Jelenlegi hely

Nagyméretű szöveges adatbázisok felhasználása természetesnyelv-feldolgozási feladatokban

A témát kiíró oktató neve: 
Berend Gábor
Meghirdető egység: 
Számítógépes Algoritmusok és Mesterséges Intelligencia
Típus: 
Szakdolgozat
A feladat megnevezés: 
Nagyméretű szöveges adatbázisok felhasználása természetesnyelv-feldolgozási feladatokban
A feladat angol megnevezése: 
Applying Large-scaled Corpora for Natural Language Processing Tasks
Hány fő jeletkezhet: 
1
Milyen szakos hallgatók számára: 
Gazdaságinformatikus BSc
Mérnökinformatikus BSc
Programtervező informatikus BSc
Molekuláris bioninka BSc
Gazdaságinformatikus MSc
Info-bionika mérnöki MSc
Mérnökinformatikus MSc
Programtervező informatikus MSc
Feladat rövid leírása: 

Az extrém nagy méretű szöveges adatbázisok (korpuszok) könnyen hozzáférhetők manapság (pl. Wikipedia vagy a web egésze). Ezek vizsgálata, például a bennük fellelhető kollokációk/szóegyüttesek vizsgálatán keresztül nagy segítséget jelenthetnek a természetesnyelv-feldolgozás számos területén. A kutatási téma feldolgozójának a nagy méretű szöveges adathalmazok hatékony kezelésének sajátosságainak szem előtt tartása mellett kell a korpuszokból kinyerhető információkat végalkalmazásban hasznosítania.
 

Szakirodalom: 

Angol nyelvű szakirodalom áll rendelkezésre.

Előismeretek, feltételek: 

Algoritmusok és adatszerkezetek I., mesterséges intelligencia

Engedélyezte: 
Imreh Csanád
Választható: 
igen