Oskar
Jarczyk
Artificial
intelligence expert
@ Deep.BI, PhD in
Social I...
Temat: Namiastka data miningu
Mam bazę danych utworów Juliusza Słowackiego w MySql, interesuje mnie stworzenie statystyk, np częstotliwość występowania wyrazów, oraz odnalezienie sieci powiązań między poszczególnymi rekordami (utworami, np z uwagi na słowa kluczowe oraz datę powstania).Jestem zupełnie zielony w tym temacie, chciałbym chociaż napisać moduł zliczający słowa we wszystkich rekordach i podający częstotliwość występowania, może jakiś mini crawler ? Generalnie wszystko znajduje się w jednej tabeli (za wyjątkami tabel - nadkategorii ale to już szczegół na później).
W jakiś sposób można do tego ogólnikowo podejść?
Dziękuję.