Nasza Loteria NaM - pasek na kartach artykułów

Naukowcy z PWr tworzą w sieci system NEKST

Zuza Gunia
Zuza Gunia
Częścią systemu NEKST będzie innowacyjna wyszukiwarka o roboczej ...
Częścią systemu NEKST będzie innowacyjna wyszukiwarka o roboczej ... Victor 1552/flickr/CC-BY02/http://creativecommons.org/licenses/by/2.0/
Częścią systemu NEKST będzie innowacyjna wyszukiwarka o roboczej nazwie BEATKA, przystosowana do analizy polskiego Internetu. Projekt ma ruszyć wiosną.

NEKST łączy w ramach jednej strony WWW innowacyjną wyszukiwarkę internetową (o roboczej nazwie BEATKA) i kilka innych programów, opracowywanych przez naukowców z Politechniki Wrocławskiej i Instytutu Podstaw Informatyki PAN. Całość składa się z systemu odpowiedzi na pytania o roboczej nazwie "Borsuk",  wyszukiwarki dostosowanej do języka polskiego, systemu wydobywania informacji z tekstu oraz wyszukiwarki zdjęć podobnych do zdjęcia podanego przez użytkownika.

Wyszukiwarka BEATKA została zbudowana przez Instytut Podstaw Informatyki PAN w Warszawie, pozostałe programy powstały w Instytucie Informatyki Politechniki Wrocławskiej. Całość systemu jest również łączona we Wrocławiu.

Jak to działa? Użytkownik zadaje jedno pytanie w systemie, który decyduje, jakich modułów użyć, aby najlepiej pomóc w odnalezieniu danej informacji.

- W założeniach NEKST ma działać w taki sposób, że pytanie jest zadawane pełnym zdaniem. System odpowiedzi na pytania analizuje strukturę gramatyczną pytania oraz do pewnego stopnia jego znaczenie. Następnie stara się odnaleźć dokumenty, które są najlepiej dopasowane do pytania i jego tematyki - opowiada dr Maciej Piasecki, który zajmuje się projektem na Politechnice Wrocławskiej.

Czym wyszukiwarka BEATKA będzie się wyróżniała?

- Przede wszystkim jest ukierunkowana na język polski, bada dokumenty także pod względem ich struktury językowej, np. występujących w nich nazw własnych, terminów czy też niektórych związków gramatycznych. Jest to system prototypowy, więc niestety nie będzie też działał zbyt szybko w porównaniu z komercyjnymi wyszukiwarkami - wyjaśnia Piasecki.

Aby była możliwa analiza polskich zdań i tekstu, konieczne było skonstruowanie baz wiedzy, opisujących język polski oraz programów do automatycznej analizy polskich struktur gramatycznych i znaczeniowych. Konstrukcja takiej technologii dla języka polskiego była niezwykle ważnym celem dwóch pierwszych lat projektu NEKST.

Słownik w słowosieci Przykładem jednej z baz wiedzy jest

Słowosieć

- największy dostępny publicznie słownik języka polskiego, opisujący znaczenia słów w sposób sformalizowany w postaci sieci znaczeniowej, zrozumiałej dla programów komputerowych.

- Myślę, że cały system oraz jego poszczególnego moduły mogą być wykorzystywane również w dużych korporacjach jako istotna część systemu zarządzania wiedzą dla polskich użytkowników, podobne systemy opracowane dla języka angielskiego, nie są do końca skuteczne w odniesieniu do polskich dokumentów - mówi
Piasecki.

Prace nad projektem, który we Wrocławiu zrealizowała Grupa Naukowa G4.19, trwały cztery lata. Pracowało nad nim około 25 osób we wrocławskiej części (i co najmniej drugie tyle w warszawskiej części): informatycy i lingwiści. W projekcie brało też udział wielu studentów różnych specjalności. W ciągu 2-3 najbliższych miesięcy system NEKST ma się pojawić w sieci i każdy użytkownik za darmo będzie mógł z niego skorzystać.

Projekt został sfinansowany przez Unię Europejską.

od 7 lat
Wideo

Precz z Zielonym Ładem! - protest rolników w Warszawie

Dołącz do nas na Facebooku!

Publikujemy najciekawsze artykuły, wydarzenia i konkursy. Jesteśmy tam gdzie nasi czytelnicy!

Polub nas na Facebooku!

Kontakt z redakcją

Byłeś świadkiem ważnego zdarzenia? Widziałeś coś interesującego? Zrobiłeś ciekawe zdjęcie lub wideo?

Napisz do nas!

Polecane oferty

Materiały promocyjne partnera
Wróć na wroclaw.naszemiasto.pl Nasze Miasto