Доступ:
Access note:
Zugangshinweis:
Корпуса доступны для научных исследований по запросу. Если вы хотите получить доступ, напишите мне на почту corpora [at] fisun.org, указав своё имя, организацию и цель исследования, и я с удовольствием вам его предоставлю.
These corpora are available for research use upon request. If you would like access, please email me at corpora [at] fisun.org with your name, affiliation, and research purpose. I’ll be glad to share access details for research projects.
Diese Korpora sind auf Anfrage für Forschungszwecke verfügbar. Wenn Sie Zugang wünschen, senden Sie mir bitte eine E-Mail an corpora [at] fisun.org mit Ihrem Namen, Ihrer Institution und dem Zweck Ihrer Forschung. Ich freue mich, Ihnen für Forschungsprojekte Zugangsdaten zu übermitteln.
Представленные ниже корпуса доступны через NoSketch Engine и KonText (в разработке). Корпуса с синтаксической разметкой поддерживают также поиск по зависимостям через SyntSearch — специализированный инструмент для запросов к UD-разметке, которая не полностью поддерживаются языком CQL, используемым в SketchEngine и KonText. LemmaSketches позволяет строить синтаксические словесные портреты и коллокационные профили, группируя коллокаты по синтаксическим отношениям и сопоставляя данные по корпусам, леммам и с Национальным корпусом русского языка. Результаты можно экспортировать в CSV или сохранять в PNG, в том числе в чёрно-белом варианте. Graphs — ещё один специально разработанный инструмент, который позволяет визуализировать диахроническую динамику в виде линейных графиков по годам и сравнивать распределение слов по корпусам и подкорпусам.
The corpora listed below are available via NoSketch Engine and KonText (in development). Corpora with syntactic annotation also support dependency-based search through SyntSearch, a specialized tool for UD-based queries not fully supported by the CQL used in SketchEngine and KonText. LemmaSketches generates syntactic word sketches and collocation profiles, grouping collocates by syntactic relation and comparing data across corpora, lemmas, and the Russian National Corpus. Results can be exported as CSV or downloaded as PNG, including a black-and-white version. Graphs is another custom-built tool that visualizes diachronic trends in yearly line charts and compares word distributions across corpora and subcorpora.
Die unten aufgeführten Korpora sind über NoSketch Engine und KonText (in Entwicklung) zugänglich. Korpora mit syntaktischer Annotation unterstützen außerdem die dependenzbasierte Suche über SyntSearch, ein spezialisiertes Werkzeug für UD-basierte Abfragen, die durch CQL in SketchEngine und KonText nicht vollständig abgedeckt werden. LemmaSketches erstellt syntaktische Wortprofile und Kollokationsprofile, gruppiert Kollokate nach syntaktischen Relationen und ermöglicht Vergleiche zwischen Korpora, Lemmata und dem Russischen Nationalkorpus. Die Ergebnisse lassen sich als CSV exportieren oder als PNG herunterladen, auch in Schwarzweiß. Graphs ist ein weiteres eigens entwickeltes Werkzeug, das diachrone Entwicklungen in jährlichen Liniendiagrammen visualisiert und Wortverteilungen über Korpora und Teilkorpora hinweg vergleicht.
-
Интерфейс корпусного поиска:
Corpus query interface:
Korpusabfrage:
https://noske.fisun.org/
- Поиск по синтаксическим зависимостям:
Dependency-based search:
Dependenzbasierte Suche:
SyntSearch
- Синтаксические скетчи:
Syntactic word sketches:
Syntaktische Sketches:
LemmaSketches
- Интерактивная визуализация частотности:
Interactive frequency visualization:
Interaktive Frequenzvisualisierung:
Graphs
Описания корпусов, сведения о составе, лицензионные условия и рекомендуемые формы цитирования см. на страницах «Информация о корпусе», ссылки на которые приведены ниже.
For corpus descriptions, compilation details, licensing information, and suggested citations, see the “Corpus info” pages linked below.
Beschreibungen der Korpora, Angaben zur Zusammenstellung, Lizenzhinweise und Zitierempfehlungen finden Sie auf den unten verlinkten Seiten „Korpusinfo“.
OrthRus v2требуется регистрацияregistration requiredRegistrierung erforderlich
Большой многожанровый русский корпус православного религиозного дискурса, собранный по материалам нескольких порталов и разных типов текстов (данные собраны в декабре 2025 и мае 2026 г.). В корпус входят журнальные материалы, новости и аналитические статьи православной тематики, разделы «вопрос–ответ» («вопрос священнику»), а также тексты православной цифровой библиотеки — книги, учебные пособия и научные работы.
A large multi-genre Russian corpus of Orthodox religious discourse compiled from several portals and text types (data collected in December 2025 and May 2026). It includes magazine content, news and analytical articles with an Orthodox focus, Q&A materials (“ask a priest”), and texts from an Orthodox digital library, including books, textbooks, and academic works.
Ein großes russisches Mehrgenre-Korpus des orthodoxen religiösen Diskurses, zusammengestellt aus mehreren Portalen und unterschiedlichen Textsorten (Daten erhoben im Dezember 2025 und Mai 2026). Es umfasst Magazinbeiträge, Nachrichten und analytische Artikel mit orthodoxem Schwerpunkt, Frage-Antwort-Materialien („Fragen an Priester“) sowie Texte aus einer orthodoxen digitalen Bibliothek, darunter Bücher, Lehrmaterialien und wissenschaftliche Arbeiten.
ТокеныTokensToken312,721,232
Документы (<doc>)Documents (<doc>)Dokumente (<doc>)335,590
Корпус, составленный по материалам pravoslavie.ru, sedmitza.ru, patriarchia.ru, dialog.elitsy.ru, foma.ru, azbyka.ru и pravmir.ru.
A multi-source corpus compiled from pravoslavie.ru, sedmitza.ru, patriarchia.ru, dialog.elitsy.ru, foma.ru, azbyka.ru, and pravmir.ru.
Ein mehrquelliges Korpus aus Materialien von pravoslavie.ru, sedmitza.ru, patriarchia.ru, dialog.elitsy.ru, foma.ru, azbyka.ru und pravmir.ru.
OrthRus v1требуется регистрацияregistration requiredRegistrierung erforderlich
Большой многожанровый русский корпус православного религиозного дискурса, собранный по материалам нескольких порталов (данные собраны в декабре 2025 и январе 2026 г.). Включает журнальные материалы, новости, тематические статьи, тексты формата «вопрос–ответ» и материалы православной цифровой библиотеки.
A large multi-genre Russian corpus of Orthodox religious discourse compiled from several portals (data collected in December 2025 and January 2026). It includes magazine content, news, topical articles, Q&A materials, and texts from an Orthodox digital library.
Ein großes russisches Mehrgenre-Korpus des orthodoxen religiösen Diskurses, zusammengestellt aus mehreren Portalen (Daten erhoben im Dezember 2025 und Januar 2026). Es umfasst Magazinbeiträge, Nachrichten, thematische Artikel, Frage-Antwort-Materialien und Texte aus einer orthodoxen digitalen Bibliothek.
ТокеныTokensToken232,687,568
Документы (<doc>)Documents (<doc>)Dokumente (<doc>)223,666
Корпус, составленный по материалам patriarchia.ru, dialog.elitsy.ru, foma.ru, azbyka.ru и pravmir.ru.
A multi-source corpus compiled from patriarchia.ru, dialog.elitsy.ru, foma.ru, azbyka.ru, and pravmir.ru.
Ein mehrquelliges Korpus aus Materialien von patriarchia.ru, dialog.elitsy.ru, foma.ru, azbyka.ru und pravmir.ru.
Vopros требуется регистрацияregistration requiredRegistrierung erforderlich
Корпус религиозного дискурса в формате «вопрос–ответ» (вопросы и опубликованные ответы), собранный по материалам нескольких православных веб-порталов (данные декабря 2025 г.). Ответы не всегда принадлежат священникам; во многих случаях их дают другие церковные авторы и консультанты, выступающие от имени соответствующих площадок.
A corpus of religious discourse in a Q&A format (questions and published answers) compiled from several Russian Orthodox web portals (data collected in December 2025). Answers are not always written by priests; many are provided by other church-affiliated authors and advisers writing on behalf of the respective platforms.
Ein Korpus religiösen Diskurses im Frage-Antwort-Format (Fragen und veröffentlichte Antworten), zusammengestellt aus mehreren russisch-orthodoxen Webportalen (Daten erhoben im Dezember 2025). Die Antworten stammen nicht immer von Priestern; in vielen Fällen wurden sie von anderen kirchlichen Autoren und Beratern im Namen der jeweiligen Plattformen verfasst.
ТокеныTokensToken15,568,332
Документы (<doc>)Documents (<doc>)Dokumente (<doc>)67,771
Вопросы (<question>)Question segments (<question>)Fragesegmente (<question>)71,510
Ответы (<answer>)Answer segments (<answer>)Antwortsegmente (<answer>)94,277
Источники: разделы Q&A на azbyka.ru и foma.ru, а также материалы Q&A с elitsy.ru и pravmir.ru.
Sources include Q&A sections of azbyka.ru and foma.ru, along with Q&A materials from elitsy.ru and pravmir.ru.
Quellen sind die Q&A-Bereiche von azbyka.ru und foma.ru sowie Q&A-Materialien von elitsy.ru und pravmir.ru.
Foma требуется регистрацияregistration requiredRegistrierung erforderlich
Русский корпус, собранный по материалам сайта православного журнала «Фома» (foma.ru), без текстов формата «вопрос–ответ» (данные декабря 2025 г.).
A Russian corpus compiled from the website of the Russian Orthodox magazine Foma (foma.ru), excluding Q&A content (data collected in December 2025).
Ein russisches Korpus, zusammengestellt aus dem Webauftritt der russisch-orthodoxen Zeitschrift Foma (foma.ru), ohne Q&A-Inhalte (Daten erhoben im Dezember 2025).
ТокеныTokensToken29,890,878
Документы (<doc>)Documents (<doc>)Dokumente (<doc>)31,744
Примечание: корпус включает материалы foma.ru вне разделов Q&A.
Note: the corpus contains materials from foma.ru outside the Q&A sections.
Hinweis: Das Korpus enthält Materialien von foma.ru außerhalb der Q&A-Bereiche.
Otechnik_20 требуется регистрацияregistration requiredRegistrierung erforderlich
Русский корпус, собранный по материалам онлайн-библиотеки «Отечник» на портале «Азбука» (azbyka.ru) и включающий только тексты авторов, родившихся в XX веке (данные декабря 2025 г.).
A Russian corpus compiled from the “Otechnik” online library on the Russian Orthodox portal Azbyka (azbyka.ru), containing only texts by authors born in the 20th century (data collected in December 2025).
Ein russisches Korpus, zusammengestellt aus der Online-Bibliothek „Otechnik“ auf dem russisch-orthodoxen Portal Azbyka (azbyka.ru), das nur Texte von Autoren enthält, die im 20. Jahrhundert geboren wurden (Daten erhoben im Dezember 2025).
ТокеныTokensToken87,801,535
Документы (<doc>)Documents (<doc>)Dokumente (<doc>)3,273
Источник: azbyka.ru → онлайн-библиотека «Отечник» (только авторы XX века).
Source: azbyka.ru → Otechnik online library (20th-century authors only).
Quelle: azbyka.ru → Online-Bibliothek „Otechnik“ (nur Autoren des 20. Jahrhunderts).
IslamRus требуется регистрацияregistration requiredRegistrierung erforderlich
Большой многожанровый русский корпус, собранный по материалам исламских онлайн-ресурсов из разных регионов России (данные декабря 2025 и января 2026 г.). В корпус входят новости, тематические и аналитические статьи, фетвы, тексты формата «вопрос–ответ» и практические руководства.
A large multi-genre Russian corpus compiled from Islamic online resources representing different regions of Russia (data collected in December 2025 and January 2026). It includes news, topical and analytical articles, fatwas, Q&A materials, and practical guidance texts.
Ein großes russisches Mehrgenre-Korpus, zusammengestellt aus islamischen Online-Ressourcen aus verschiedenen Regionen Russlands (Daten erhoben im Dezember 2025 und Januar 2026). Es umfasst Nachrichten, thematische und analytische Artikel, Fatwas, Frage-Antwort-Materialien und praxisorientierte Anleitungstexte.
ТокеныTokensToken36,021,460
Документы (<doc>)Documents (<doc>)Dokumente (<doc>)76,385
Корпус, составленный по материалам islam.ru, islamdag.ru, islam-today.ru, umma.ru, azan.ru и muftiyatrd.ru.
A multi-source corpus compiled from islam.ru, islamdag.ru, islam-today.ru, umma.ru, azan.ru, and muftiyatrd.ru.
Ein mehrquelliges Korpus aus Materialien von islam.ru, islamdag.ru, islam-today.ru, umma.ru, azan.ru und muftiyatrd.ru.
Islam-today требуется регистрацияregistration requiredRegistrierung erforderlich
Корпус, собранный по материалам Islam-today.ru (без текстов формата «вопрос–ответ»; данные января 2026 г.). Корпус отражает исламский религиозный дискурс в России.
A corpus compiled from Islam-today.ru (excluding Q&A content; data collected in January 2026). The corpus represents Islamic religious discourse in Russia.
Ein Korpus aus Materialien von Islam-today.ru (ohne Q&A-Inhalte; Daten erhoben im Januar 2026). Das Korpus bildet den islamischen religiösen Diskurs in Russland ab.
ТокеныTokensToken7,170,001
Документы (<doc>)Documents (<doc>)Dokumente (<doc>)9,498
Otvet_islam требуется регистрацияregistration requiredRegistrierung erforderlich
Корпус исламского религиозного дискурса в формате «вопрос–ответ» (вопросы и опубликованные ответы), включая фетвы и экспертные ответы, собранный по материалам нескольких российских веб-порталов (данные января 2026 г.). Ответы принадлежат исламским учёным, муфтиям и имамам из разных регионов России.
A corpus of Islamic religious discourse in a Q&A format (questions and published answers), including fatwas and expert replies, compiled from several Russian web portals (data collected in January 2026). Answers are written by Islamic scholars, muftis, and imams from different regions of Russia.
Ein Korpus islamischen religiösen Diskurses im Frage-Antwort-Format (Fragen und veröffentlichte Antworten), darunter Fatwas und fachliche Antworten, zusammengestellt aus mehreren russischen Webportalen (Daten erhoben im Januar 2026). Die Antworten stammen von islamischen Gelehrten, Muftis und Imamen aus verschiedenen Regionen Russlands.
ТокеныTokensToken2,363,889
Документы (<doc>)Documents (<doc>)Dokumente (<doc>)4,073
Сегменты вопросов (<question>)Question segments (<question>)Fragesegmente (<question>)4,023
Сегменты ответов (<answer>)Answer segments (<answer>)Antwortsegmente (<answer>)4,071
Источники: разделы Q&A на muftiyatrd.ru, islam-today.ru, islam.ru, islamdag.ru и azan.ru.
Sources include Q&A sections of muftiyatrd.ru, islam-today.ru, islam.ru, islamdag.ru, and azan.ru.
Quellen sind die Q&A-Bereiche von muftiyatrd.ru, islam-today.ru, islam.ru, islamdag.ru und azan.ru.