NEKST łączy w ramach jednej strony WWW innowacyjną wyszukiwarkę internetową (o roboczej nazwie BEATKA) i kilka innych programów, opracowywanych przez naukowców z Politechniki Wrocławskiej i Instytutu Podstaw Informatyki PAN. Całość składa się z systemu odpowiedzi na pytania o roboczej nazwie "Borsuk", wyszukiwarki dostosowanej do języka polskiego, systemu wydobywania informacji z tekstu oraz wyszukiwarki zdjęć podobnych do zdjęcia podanego przez użytkownika.
Wyszukiwarka BEATKA została zbudowana przez Instytut Podstaw Informatyki PAN w Warszawie, pozostałe programy powstały w Instytucie Informatyki Politechniki Wrocławskiej. Całość systemu jest również łączona we Wrocławiu.
Jak to działa? Użytkownik zadaje jedno pytanie w systemie, który decyduje, jakich modułów użyć, aby najlepiej pomóc w odnalezieniu danej informacji.
- W założeniach NEKST ma działać w taki sposób, że pytanie jest zadawane pełnym zdaniem. System odpowiedzi na pytania analizuje strukturę gramatyczną pytania oraz do pewnego stopnia jego znaczenie. Następnie stara się odnaleźć dokumenty, które są najlepiej dopasowane do pytania i jego tematyki - opowiada dr Maciej Piasecki, który zajmuje się projektem na Politechnice Wrocławskiej.
Czym wyszukiwarka BEATKA będzie się wyróżniała?
- Przede wszystkim jest ukierunkowana na język polski, bada dokumenty także pod względem ich struktury językowej, np. występujących w nich nazw własnych, terminów czy też niektórych związków gramatycznych. Jest to system prototypowy, więc niestety nie będzie też działał zbyt szybko w porównaniu z komercyjnymi wyszukiwarkami - wyjaśnia Piasecki.
Aby była możliwa analiza polskich zdań i tekstu, konieczne było skonstruowanie baz wiedzy, opisujących język polski oraz programów do automatycznej analizy polskich struktur gramatycznych i znaczeniowych. Konstrukcja takiej technologii dla języka polskiego była niezwykle ważnym celem dwóch pierwszych lat projektu NEKST.
Słownik w słowosieci Przykładem jednej z baz wiedzy jest
Słowosieć- największy dostępny publicznie słownik języka polskiego, opisujący znaczenia słów w sposób sformalizowany w postaci sieci znaczeniowej, zrozumiałej dla programów komputerowych.
- Myślę, że cały system oraz jego poszczególnego moduły mogą być wykorzystywane również w dużych korporacjach jako istotna część systemu zarządzania wiedzą dla polskich użytkowników, podobne systemy opracowane dla języka angielskiego, nie są do końca skuteczne w odniesieniu do polskich dokumentów - mówi
Piasecki.
Prace nad projektem, który we Wrocławiu zrealizowała Grupa Naukowa G4.19, trwały cztery lata. Pracowało nad nim około 25 osób we wrocławskiej części (i co najmniej drugie tyle w warszawskiej części): informatycy i lingwiści. W projekcie brało też udział wielu studentów różnych specjalności. W ciągu 2-3 najbliższych miesięcy system NEKST ma się pojawić w sieci i każdy użytkownik za darmo będzie mógł z niego skorzystać.
Projekt został sfinansowany przez Unię Europejską.
Precz z Zielonym Ładem! - protest rolników w Warszawie
Dołącz do nas na Facebooku!
Publikujemy najciekawsze artykuły, wydarzenia i konkursy. Jesteśmy tam gdzie nasi czytelnicy!
Kontakt z redakcją
Byłeś świadkiem ważnego zdarzenia? Widziałeś coś interesującego? Zrobiłeś ciekawe zdjęcie lub wideo?