Paweł Grzegorz
Kwiatkowski
Architekt
oprogramowania,
Ericsson
Temat: Estymacje
Sytuacja wygląda tak, że chcę szacować czas obsługi zgłoszeń w "issue trackerze".Zakładam, że na wejściu dane są atrybuty zgłoszenia - np. treść, priorytet, komponent, obszar funkcjonalny, przejścia stanów zgłoszenia, etc.
Trywialna estymata, to uśrednienie danych historycznych po grupach atrybutów i gotowe... ale dla próbki:
Komponent=Modul1, Priortyet=2, Opis="Nie działa"
Komponent=Modul1, Priotytet=2, Opis="Dla roli XYZ brak widoku ABC"
Komponent=Modul1, Priotytet=2, Opis="Dla roli ABC brak widoku DEF"
i rzeczywistych czasów obsługi np. 4, 1, 1 wychodzi średnio: 2 dni/godziny/...
Estymata 2 dni dla zgłoszenia z opisem "Nie działa" jest dość ryzykowna, stąd kolejny pomysł, to K-Means + algorytm wyliczający podobieństwo tekstów (tak, żeby "Nie działa" i "Dla roli XYZ brak widoku ABC" były traktowane jako dostatecznie odległe by wpaść do innych klastrów, zaś "Dla roli..." jako podobne) i uśrednianie po klastrach.
Może ktoś zajmował się podobnym zagadnieniem i podzieli się spostrzeżeniami? np. niektóre kierunki skazana są na porażkę, albo "lepiej zrobić tak i tak".