Maria S.

Maria S. Civis totius
mundi...

Temat: Narodowy Korpus Języka Polskiego

Instytut Podstaw Informatyki PAN, Instytut Języka Polskiego PAN, Instytut Anglistyki Uniwersytetu Łódzkiego oraz Wydawnictwo Naukowe PWN wspólnie tworzą Narodowy Korpus Języka Polskiego. NKJP powstaje pod egidą Ministerstwa Nauki i Szkolnictwa Wyższego jako Projekt Badawczo-Rozwojowy Nr R17 003 03.

Korpus to wielki zbiór tekstów polskich, zrównoważony tematycznie, gatunkowo i chronologicznie, reprezentatywny dla współczesnych zwyczajów językowych i zasad gramatycznych, stworzony do celów badawczych i słownikowych. W Narodowym Korpusie Języka Polskiego, liczącym setki milionów słów, dostępnym publicznie i bezpłatnie na stronach WWW, każdy będzie mógł sprawdzić nie tylko poprawność gramatyczną i częstość słowa, ale także typową łączliwość i skojarzenia, jakie słowa budzą. Posłużą do tego wyrafinowane narzędzia wyszukiwania. Korpus gromadzi trzon klasyki literatury polskiej, można w nim więc także wyszukiwać skrzydlate słowa.

Korpusu nie stworzymy bez pomocy autorów i wydawców książek, dlatego dzięki uprzejmości władz Polskiej Izby Książki zwracamy się do wszystkich Państwa z apelem o udostępnianie do NKJP tekstów polskich współczesnych i z ostatniego stulecia.

Swoje korpusy narodowe maja już w Internecie Brytyjczycy, Czesi, Rosjanie i większość narodów (języków) Europy. Wielki korpus, dostępny publicznie, jest niezbędny już dziś językoznawcom, historykom, filologom, tłumaczom, a w przyszłości może usprawnić pracę dziennikarzy, wydawców, copywriterów i wszystkich ludzi słowa. Pierwsza wersja korpusu będzie dostępna jesienią na stronie http://nkjp.pl. Na razie na stronie są informacje o korpusie.

Teksty, które zgodzą się Państwo włączyć do NKJP we fragmentach lub w całości, będą źródłem krótkich cytatów ilustrujących znaczenia słów i wyrażeń, tak jak ilustrują je cytaty słownikowe. Cytatom towarzyszą tytuły dzieł, nazwiska autorów i nazwy wydawców. Udostępniając tekst do NKJP, nie ryzykują Państwo, że ukaże się on w Internecie w większych fragmentach.

Teksty do NKJP przyjmujemy w dowolnym formacie, następnie konwertujemy do formatu XML, znakujemy gramatycznie oraz strukturalnie. Akwizycję tekstów pisanych do NKJP koordynują z Warszawy - dr hab. Marek Łaziński (Wydawnictwo Naukowe PWN, e-mail: Marek.Lazinski@pwn.com.pl) oraz z Krakowa - Rafał L. Górski (Instytut Języka Polskiego PAN).

Tak jak korpusy zagraniczne, nie płacimy autorom ani wydawcom za prawo udostępnienia cytatów z ich książek. Na stronach korpusu, które - tak jak na całym świecie - będą odwiedzać głównie studenci, badacze języka, historii i społeczeństwa, umieścimy podziękowania dla wydawców wspomagającym korpus oraz ewentualnie notki o najnowszych włączonych doń książkach.

Chętnie odpowiemy na wszelkie pytania i rozwiejemy wątpliwości dotyczące Narodowego Korpusu Języka Polskiego.
za http://www.nkjp.pl./Maria S. edytował(a) ten post dnia 08.08.08 o godzinie 11:50