Религиозные корпуса русского языка Russian Religious Corpora Russische religiöse Korpora

Специализированная коллекция лингвистически аннотированных русских корпусов религиозных текстов и дискурса. A specialized collection of linguistically annotated Russian corpora of religious texts and religious discourse. Eine spezialisierte Sammlung linguistisch annotierter russischer Korpora religiöser Texte und religiösen Diskurses.

Доступ: Access note: Zugangshinweis: Корпуса доступны для научных исследований по запросу. Если вы хотите получить доступ, напишите мне на почту corpora [at] fisun.org, указав своё имя, организацию и цель исследования, и я с удовольствием вам его предоставлю. These corpora are available for research use upon request. If you would like access, please email me at corpora [at] fisun.org with your name, affiliation, and research purpose. I’ll be glad to share access details for research projects. Diese Korpora sind auf Anfrage für Forschungszwecke verfügbar. Wenn Sie Zugang wünschen, senden Sie mir bitte eine E-Mail an corpora [at] fisun.org mit Ihrem Namen, Ihrer Institution und dem Zweck Ihrer Forschung. Ich freue mich, Ihnen für Forschungsprojekte Zugangsdaten zu übermitteln.


Представленные ниже корпуса доступны через NoSketch Engine и KonText (в разработке). Корпуса с синтаксической разметкой поддерживают также поиск по зависимостям через SyntSearch — специализированный инструмент для запросов к UD-разметке, которая не полностью поддерживаются языком CQL, используемым в SketchEngine и KonText. LemmaSketches позволяет строить синтаксические словесные портреты и коллокационные профили, группируя коллокаты по синтаксическим отношениям и сопоставляя данные по корпусам, леммам и с Национальным корпусом русского языка. Результаты можно экспортировать в CSV или сохранять в PNG, в том числе в чёрно-белом варианте. Graphs — ещё один специально разработанный инструмент, который позволяет визуализировать диахроническую динамику в виде линейных графиков по годам и сравнивать распределение слов по корпусам и подкорпусам. The corpora listed below are available via NoSketch Engine and KonText (in development). Corpora with syntactic annotation also support dependency-based search through SyntSearch, a specialized tool for UD-based queries not fully supported by the CQL used in SketchEngine and KonText. LemmaSketches generates syntactic word sketches and collocation profiles, grouping collocates by syntactic relation and comparing data across corpora, lemmas, and the Russian National Corpus. Results can be exported as CSV or downloaded as PNG, including a black-and-white version. Graphs is another custom-built tool that visualizes diachronic trends in yearly line charts and compares word distributions across corpora and subcorpora. Die unten aufgeführten Korpora sind über NoSketch Engine und KonText (in Entwicklung) zugänglich. Korpora mit syntaktischer Annotation unterstützen außerdem die dependenzbasierte Suche über SyntSearch, ein spezialisiertes Werkzeug für UD-basierte Abfragen, die durch CQL in SketchEngine und KonText nicht vollständig abgedeckt werden. LemmaSketches erstellt syntaktische Wortprofile und Kollokationsprofile, gruppiert Kollokate nach syntaktischen Relationen und ermöglicht Vergleiche zwischen Korpora, Lemmata und dem Russischen Nationalkorpus. Die Ergebnisse lassen sich als CSV exportieren oder als PNG herunterladen, auch in Schwarzweiß. Graphs ist ein weiteres eigens entwickeltes Werkzeug, das diachrone Entwicklungen in jährlichen Liniendiagrammen visualisiert und Wortverteilungen über Korpora und Teilkorpora hinweg vergleicht.

Описания корпусов, сведения о составе, лицензионные условия и рекомендуемые формы цитирования см. на страницах «Информация о корпусе», ссылки на которые приведены ниже. For corpus descriptions, compilation details, licensing information, and suggested citations, see the “Corpus info” pages linked below. Beschreibungen der Korpora, Angaben zur Zusammenstellung, Lizenzhinweise und Zitierempfehlungen finden Sie auf den unten verlinkten Seiten „Korpusinfo“.

Корпуса православного религиозного дискурса Corpora of Orthodox religious discourse Korpora des orthodoxen religiösen Diskurses

OrthRus v2требуется регистрацияregistration requiredRegistrierung erforderlich

Большой многожанровый русский корпус православного религиозного дискурса, собранный по материалам нескольких порталов и разных типов текстов (данные собраны в декабре 2025 и мае 2026 г.). В корпус входят журнальные материалы, новости и аналитические статьи православной тематики, разделы «вопрос–ответ» («вопрос священнику»), а также тексты православной цифровой библиотеки — книги, учебные пособия и научные работы. A large multi-genre Russian corpus of Orthodox religious discourse compiled from several portals and text types (data collected in December 2025 and May 2026). It includes magazine content, news and analytical articles with an Orthodox focus, Q&A materials (“ask a priest”), and texts from an Orthodox digital library, including books, textbooks, and academic works. Ein großes russisches Mehrgenre-Korpus des orthodoxen religiösen Diskurses, zusammengestellt aus mehreren Portalen und unterschiedlichen Textsorten (Daten erhoben im Dezember 2025 und Mai 2026). Es umfasst Magazinbeiträge, Nachrichten und analytische Artikel mit orthodoxem Schwerpunkt, Frage-Antwort-Materialien („Fragen an Priester“) sowie Texte aus einer orthodoxen digitalen Bibliothek, darunter Bücher, Lehrmaterialien und wissenschaftliche Arbeiten.

ТокеныTokensToken312,721,232
Документы (<doc>)Documents (<doc>)Dokumente (<doc>)335,590

Корпус, составленный по материалам pravoslavie.ru, sedmitza.ru, patriarchia.ru, dialog.elitsy.ru, foma.ru, azbyka.ru и pravmir.ru. A multi-source corpus compiled from pravoslavie.ru, sedmitza.ru, patriarchia.ru, dialog.elitsy.ru, foma.ru, azbyka.ru, and pravmir.ru. Ein mehrquelliges Korpus aus Materialien von pravoslavie.ru, sedmitza.ru, patriarchia.ru, dialog.elitsy.ru, foma.ru, azbyka.ru und pravmir.ru.

OrthRus v1требуется регистрацияregistration requiredRegistrierung erforderlich

Большой многожанровый русский корпус православного религиозного дискурса, собранный по материалам нескольких порталов (данные собраны в декабре 2025 и январе 2026 г.). Включает журнальные материалы, новости, тематические статьи, тексты формата «вопрос–ответ» и материалы православной цифровой библиотеки. A large multi-genre Russian corpus of Orthodox religious discourse compiled from several portals (data collected in December 2025 and January 2026). It includes magazine content, news, topical articles, Q&A materials, and texts from an Orthodox digital library. Ein großes russisches Mehrgenre-Korpus des orthodoxen religiösen Diskurses, zusammengestellt aus mehreren Portalen (Daten erhoben im Dezember 2025 und Januar 2026). Es umfasst Magazinbeiträge, Nachrichten, thematische Artikel, Frage-Antwort-Materialien und Texte aus einer orthodoxen digitalen Bibliothek.

ТокеныTokensToken232,687,568
Документы (<doc>)Documents (<doc>)Dokumente (<doc>)223,666

Корпус, составленный по материалам patriarchia.ru, dialog.elitsy.ru, foma.ru, azbyka.ru и pravmir.ru. A multi-source corpus compiled from patriarchia.ru, dialog.elitsy.ru, foma.ru, azbyka.ru, and pravmir.ru. Ein mehrquelliges Korpus aus Materialien von patriarchia.ru, dialog.elitsy.ru, foma.ru, azbyka.ru und pravmir.ru.

Vopros требуется регистрацияregistration requiredRegistrierung erforderlich

Корпус религиозного дискурса в формате «вопрос–ответ» (вопросы и опубликованные ответы), собранный по материалам нескольких православных веб-порталов (данные декабря 2025 г.). Ответы не всегда принадлежат священникам; во многих случаях их дают другие церковные авторы и консультанты, выступающие от имени соответствующих площадок. A corpus of religious discourse in a Q&A format (questions and published answers) compiled from several Russian Orthodox web portals (data collected in December 2025). Answers are not always written by priests; many are provided by other church-affiliated authors and advisers writing on behalf of the respective platforms. Ein Korpus religiösen Diskurses im Frage-Antwort-Format (Fragen und veröffentlichte Antworten), zusammengestellt aus mehreren russisch-orthodoxen Webportalen (Daten erhoben im Dezember 2025). Die Antworten stammen nicht immer von Priestern; in vielen Fällen wurden sie von anderen kirchlichen Autoren und Beratern im Namen der jeweiligen Plattformen verfasst.

ТокеныTokensToken15,568,332
Документы (<doc>)Documents (<doc>)Dokumente (<doc>)67,771
Вопросы (<question>)Question segments (<question>)Fragesegmente (<question>)71,510
Ответы (<answer>)Answer segments (<answer>)Antwortsegmente (<answer>)94,277

Источники: разделы Q&A на azbyka.ru и foma.ru, а также материалы Q&A с elitsy.ru и pravmir.ru. Sources include Q&A sections of azbyka.ru and foma.ru, along with Q&A materials from elitsy.ru and pravmir.ru. Quellen sind die Q&A-Bereiche von azbyka.ru und foma.ru sowie Q&A-Materialien von elitsy.ru und pravmir.ru.

Foma требуется регистрацияregistration requiredRegistrierung erforderlich

Русский корпус, собранный по материалам сайта православного журнала «Фома» (foma.ru), без текстов формата «вопрос–ответ» (данные декабря 2025 г.). A Russian corpus compiled from the website of the Russian Orthodox magazine Foma (foma.ru), excluding Q&A content (data collected in December 2025). Ein russisches Korpus, zusammengestellt aus dem Webauftritt der russisch-orthodoxen Zeitschrift Foma (foma.ru), ohne Q&A-Inhalte (Daten erhoben im Dezember 2025).

ТокеныTokensToken29,890,878
Документы (<doc>)Documents (<doc>)Dokumente (<doc>)31,744

Примечание: корпус включает материалы foma.ru вне разделов Q&A. Note: the corpus contains materials from foma.ru outside the Q&A sections. Hinweis: Das Korpus enthält Materialien von foma.ru außerhalb der Q&A-Bereiche.

Otechnik_20 требуется регистрацияregistration requiredRegistrierung erforderlich

Русский корпус, собранный по материалам онлайн-библиотеки «Отечник» на портале «Азбука» (azbyka.ru) и включающий только тексты авторов, родившихся в XX веке (данные декабря 2025 г.). A Russian corpus compiled from the “Otechnik” online library on the Russian Orthodox portal Azbyka (azbyka.ru), containing only texts by authors born in the 20th century (data collected in December 2025). Ein russisches Korpus, zusammengestellt aus der Online-Bibliothek „Otechnik“ auf dem russisch-orthodoxen Portal Azbyka (azbyka.ru), das nur Texte von Autoren enthält, die im 20. Jahrhundert geboren wurden (Daten erhoben im Dezember 2025).

ТокеныTokensToken87,801,535
Документы (<doc>)Documents (<doc>)Dokumente (<doc>)3,273

Источник: azbyka.ru → онлайн-библиотека «Отечник» (только авторы XX века). Source: azbyka.ru → Otechnik online library (20th-century authors only). Quelle: azbyka.ru → Online-Bibliothek „Otechnik“ (nur Autoren des 20. Jahrhunderts).

Корпуса исламского религиозного дискурса Corpora of Islamic religious discourse Korpora des islamischen religiösen Diskurses

IslamRus требуется регистрацияregistration requiredRegistrierung erforderlich

Большой многожанровый русский корпус, собранный по материалам исламских онлайн-ресурсов из разных регионов России (данные декабря 2025 и января 2026 г.). В корпус входят новости, тематические и аналитические статьи, фетвы, тексты формата «вопрос–ответ» и практические руководства. A large multi-genre Russian corpus compiled from Islamic online resources representing different regions of Russia (data collected in December 2025 and January 2026). It includes news, topical and analytical articles, fatwas, Q&A materials, and practical guidance texts. Ein großes russisches Mehrgenre-Korpus, zusammengestellt aus islamischen Online-Ressourcen aus verschiedenen Regionen Russlands (Daten erhoben im Dezember 2025 und Januar 2026). Es umfasst Nachrichten, thematische und analytische Artikel, Fatwas, Frage-Antwort-Materialien und praxisorientierte Anleitungstexte.

ТокеныTokensToken36,021,460
Документы (<doc>)Documents (<doc>)Dokumente (<doc>)76,385

Корпус, составленный по материалам islam.ru, islamdag.ru, islam-today.ru, umma.ru, azan.ru и muftiyatrd.ru. A multi-source corpus compiled from islam.ru, islamdag.ru, islam-today.ru, umma.ru, azan.ru, and muftiyatrd.ru. Ein mehrquelliges Korpus aus Materialien von islam.ru, islamdag.ru, islam-today.ru, umma.ru, azan.ru und muftiyatrd.ru.

Islam-today требуется регистрацияregistration requiredRegistrierung erforderlich

Корпус, собранный по материалам Islam-today.ru (без текстов формата «вопрос–ответ»; данные января 2026 г.). Корпус отражает исламский религиозный дискурс в России. A corpus compiled from Islam-today.ru (excluding Q&A content; data collected in January 2026). The corpus represents Islamic religious discourse in Russia. Ein Korpus aus Materialien von Islam-today.ru (ohne Q&A-Inhalte; Daten erhoben im Januar 2026). Das Korpus bildet den islamischen religiösen Diskurs in Russland ab.

ТокеныTokensToken7,170,001
Документы (<doc>)Documents (<doc>)Dokumente (<doc>)9,498

Otvet_islam требуется регистрацияregistration requiredRegistrierung erforderlich

Корпус исламского религиозного дискурса в формате «вопрос–ответ» (вопросы и опубликованные ответы), включая фетвы и экспертные ответы, собранный по материалам нескольких российских веб-порталов (данные января 2026 г.). Ответы принадлежат исламским учёным, муфтиям и имамам из разных регионов России. A corpus of Islamic religious discourse in a Q&A format (questions and published answers), including fatwas and expert replies, compiled from several Russian web portals (data collected in January 2026). Answers are written by Islamic scholars, muftis, and imams from different regions of Russia. Ein Korpus islamischen religiösen Diskurses im Frage-Antwort-Format (Fragen und veröffentlichte Antworten), darunter Fatwas und fachliche Antworten, zusammengestellt aus mehreren russischen Webportalen (Daten erhoben im Januar 2026). Die Antworten stammen von islamischen Gelehrten, Muftis und Imamen aus verschiedenen Regionen Russlands.

ТокеныTokensToken2,363,889
Документы (<doc>)Documents (<doc>)Dokumente (<doc>)4,073
Сегменты вопросов (<question>)Question segments (<question>)Fragesegmente (<question>)4,023
Сегменты ответов (<answer>)Answer segments (<answer>)Antwortsegmente (<answer>)4,071

Источники: разделы Q&A на muftiyatrd.ru, islam-today.ru, islam.ru, islamdag.ru и azan.ru. Sources include Q&A sections of muftiyatrd.ru, islam-today.ru, islam.ru, islamdag.ru, and azan.ru. Quellen sind die Q&A-Bereiche von muftiyatrd.ru, islam-today.ru, islam.ru, islamdag.ru und azan.ru.

Референсные корпуса (недоступны) Reference corpora (not available) Referenzkorpora (nicht verfügbar)

Russian National Corpus (gold standard sample) недоступенnot availablenicht verfügbar

nkrja_gold_standard. Этот корпус недоступен для запросов на данном сервере и предназначен только для личного использования. Датасет можно загрузить после заполнения лицензионного соглашения на https://ruscorpora.ru/page/corpora-datasets/. nkrja_gold_standard. This corpus is not available for querying on this server and is intended for personal use only. The dataset can be downloaded after filling in a license agreement at https://ruscorpora.ru/page/corpora-datasets/. nkrja_gold_standard. Dieses Korpus ist auf diesem Server nicht abfragbar und nur für den persönlichen Gebrauch bestimmt. Der Datensatz kann nach Ausfüllen einer Lizenzvereinbarung unter https://ruscorpora.ru/page/corpora-datasets/ heruntergeladen werden.

ТокеныTokensToken109,711,856
Документы (<doc>)Documents (<doc>)Dokumente (<doc>)36,541

Контакт Contact Kontakt
corpora [at] fisun.org