Le corpus LexALP comprend environ 3000 documents qui règlementent ou concernent directement les domaines de l'aménagement du territoire et du développement durable aux neuf niveaux de législation traités par le projet.
Ces documents au format électronique ont été principalement extraits de bases de données juridiques disponibles sur Internet pour les différentes législations. Ils ont été sélectionnés par des juristes à partir d'un ensemble de critères élaborés pour le projet :
- Pertinence par rapport aux domaines spécifiques de la Convention alpine (sélectionnés sur la base de l'article 9 du protocole « Aménagement du territoire et développement durable »),
- Sources primaires de droit pour chaque législation nationale ou supranationale, c'est-à-dire uniquement les textes normatifs (lois, codes, traités, etc.),
- Amendements récents et dernières versions de toutes les législations (à la date de la collecte des données, juin-août 2005),
- Documents intégraux (pas d'extraits ni de paragraphes isolés),
- Pertinence terminologique (les textes législatifs ne contenant que des données chiffrées ou des listes de toponymes ont été exclus pour ne pas encombrer le corpus avec des données non utilisables d'un point de vue terminologique).
Les documents collectés ont été classés en suivant la structure du corpus et de la banque de données terminologiques, et étiquetés selon des critères tels que la langue, la législation, le genre de document juridique, le titre, l'abréviation. Ils ont également été subdivisés en paragraphes, sections et phrases. Un alignement semi-automatique a été effectué sur tous les documents multilingues sélectionnés pour le corpus (Convention alpine et ses protocoles, traités internationaux et législation suisse).
Grâce à cette classification détaillée et à l'étiquetage des données textuelles, le corpus LexALP, qui utilise un composant du système bistro comme interface, permet une recherche avancée de termes et de phraséologie et affiche les traductions dans les quatre langues du projet.