Corpus

Page d'aide sur l'homonymie Pour les articles homonymes, voir Corpus (homonymie) et Corps.

Un corpus est un ensemble de documents, artistiques ou non (textes, images, vidéos, etc.), regroupés dans une optique précise. On peut utiliser des corpus dans plusieurs domaines : études littéraires, linguistiques, scientifiques, philosophie[1], etc.

Le corpus en linguistique

La branche de la linguistique qui se préoccupe plus spécifiquement des corpus s'appelle logiquement la linguistique de corpus. Elle est liée au développement des systèmes informatiques, en particulier à la constitution de bases de données textuelles. Depuis 2001, la revue universitaire CORPUS est dédiée à ce domaine.

On parle de corpus pour désigner l'aspect normatif de la langue : sa structure et son code en particulier. "Corpus" est généralement opposé à "status" (ou statut), qui correspond aux conditions d'utilisation de la langue. Cette opposition est commune dans l'étude des politiques linguistiques.

Other Languages
Afrikaans: Tekskorpus
العربية: أصول نصية
беларуская: Корпус тэкстаў
беларуская (тарашкевіца)‎: Корпус тэкстаў
čeština: Jazykový korpus
Deutsch: Textkorpus
Ελληνικά: Σώμα κειμένων
English: Text corpus
Esperanto: Korpuso
euskara: Testu corpus
suomi: Korpus
हिन्दी: पाठसंग्रह
magyar: Korpusz
italiano: Corpus
日本語: コーパス
Bahasa Melayu: Korpus
Nederlands: Corpus (taalkunde)
slovenčina: Korpus (jazykoveda)
slovenščina: Besedilni korpus
中文: 语料库
粵語: 語料庫