Das LexALP-Korpus umfasst ungefähr 3000 Dokumente, die innerhalb der neun analysierten Rechtssysteme die Bereiche Raumplanung und nachhaltige Entwicklung regulieren oder direkt beeinflussen.
Die für diese Textsammlung relevanten elektronischen Dokumente wurden hauptsächlich aus online zur Verfügung stehenden Rechtsdatenbanken zu den verschiedenen Systemen gewonnen und von Rechtsexperten anhand einer Reihe von Kriterien ausgewählt, die genau auf dieses Projekt zugeschnittenen sind:
- Relevanz für die spezifischen Bereiche, die besonders in Artikel 9 des Protokolls zur "Raumplanung und nachhaltigen Entwicklung" beschrieben werden;
- Primärquellen jedes Rechtssystems auf nationaler und überstaatlicher Ebene, d.h. nur normative Texte (Gesetze, Richtlinien, usw.);
- neueste Gesetzesänderungen und Versionen aller Gesetzgebungen (zur Zeit der Datensammlung: Juni - August 2005);
- vollständige Dokumente (keine einzelnen Paragraphen oder Auszüge);
- terminologische Relevanz (rechtlich relevante Gesetzgebungen, die nur Auflistungen von Zahlen, Ortsnamen usw. enthalten, werden von der Auswahl ausgeschlossen, da sie keine relevante Terminologie enthalten und das Korpus unnötig befrachten).
Die gesammelten Dokumente wurden gemäß der LexALP-Struktur für Korpus and Termbank klassifiziert und anhand von Kriterien wie Sprache, Rechtssystem, Textart, Titel und Abkürzung halbautomatisch markiert sowie in Paragraphen, Abschnitte und Sätze unterteilt.
Außerdem wurde bei allen für das Korpus ausgewählten mehrsprachigen Dokumenten (Alpenkonvention und zugehörige Protokolle, EU-Recht, internationale Verträge sowie Schweizer Recht) ein halbautomatisches Alignment durchgeführt.
Dank dieser detaillierten Klassifizierung und Markierung der Textdaten kann für das LexALP-Korpus eine weiterentwickelte Suchfunktion implementiert werden, die eine Selektion nach Termini, Phraseologie und Übersetzungsentsprechungen für alle analysierten Rechtssprachen ermöglicht. Dem LexALP-Korpus dient die Korpuskomponente von bistro als Benutzerschnittstelle.