Logo of GRAC corpus

Генеральний регіонально анотований корпус української мови (ГРАК)

В розробці з 2015 року
Logo of GRAC corpus
Foto: GRAC Corpus

Генеральний регіонально анотований корпус української мови (ГРАК)Externer Link – це велика, репрезентативна, структурована колекція текстів українською мовою у супроводі програми, яка дозволяє будувати на базі корпусу власні підкорпуси, шукати слова, граматичні форми та їх сполучення, а також обробляти результати пошуку, сортувати, робити збалансовані вибірки і одержувати різну статистичну інформацію.

Корпус призначений для здійснення лінгвістичних досліджень з граматики, лексики, історії української літературної мови, а також для використання під час укладання словників та граматик.

Корпус може бути використаний для вивчання мови на високому рівні, також при підготовці навчальних матеріалів, підручників, навчальних словників та вправ з використанням прикладів з реальних текстів, з урахуванням частотної сполучуваності тощо.

Корпус не є взірцем нормативної української мови, в ньому можуть трапитись слова і сполучення, які не відповідають сучасним нормам літературної мови.

Корпус охоплює період з 1816 по 2020 р. і містить понад 90 тисяч текстів різних жанрів, близько 26 тисяч авторів.

Просимо посилатися на ГРАК:

Генеральний регіонально анотований корпус української мови (ГРАК) / М. Шведова, Р. фон Вальденфельс, С. Яригін, А. Рисін, В. Старко, Т. Ніколаєнко та ін. – Київ, Львів, Єна, 2017-2022: uacorpus.org.

Ініціатива підтримується: