Remigiusz Siudziński

Remigiusz Siudziński Business
Intelligence Manager

Temat: MS SQL BI i statystyka

Czy oprócz data mining (drzewa decyzyjne w Analysis Services) można w MS SQL BI robić klasyczne analizy statystyczne, np. regresję liniową?

Chodzi mi o regresję na większej liczbie zmiennych niż 16 (bo takie ograniczenie stawia najnowszy Excel)

pozdrawiam
Remek

Temat: MS SQL BI i statystyka

Wg MSDN można, aczkolwiek jeszcze tego nie robiłem:
http://msdn.microsoft.com/en-us/library/cc645871.aspx
http://msdn.microsoft.com/en-us/library/ms175595.aspx

SQL Server 2008.

Resztę analiz typowo statystycznych, jeśli mają się wykonywać w jednym "wsadzie" razem z tymi obsługiwanymi przez BI, trzeba sobie dorobić ręcznie, na zasadzie procedur, ale to ciężki kawałek chleba i raczej nieopłacalny w tym przypadku :)
Piotr Śmigielski

Piotr Śmigielski Starszy Analityk
Marketingowy

Temat: MS SQL BI i statystyka

Cześć - poszukuje kontaktu z kimś kto to robi w praktyce. Chodzi mi o mi o to, że przed wykonaniem jakiejkolwiek pracy analitycznej, np. modelu regresji wykonuje się kilka, albo kilkanaście modeli i analiz pomocniczych, modyfikacji danych (braki danych obserwacje odstające etc.).

W programach do analiz statystycznych nie ma z tym najmniejszych problemów - po prostu wszystko jest oprogramowane w oddzielnych procedurach, robi się to szybko - jest do tego specjalny workflow itd.

Zastanawia mnie to jak jest w Analysis services, czy mogę sobie podłączyć jako źródło danych przygotowaną w sql serwer tabelkę i na niej pracować? Podzielić ją losowo na zbiór treningowy i testowy w kilku konfiguracjach - zrobić cztery proste sieci neuronowe i porównać ich parametry i wybrać najlepszą do zaimplementowania na sql serwerze ?

Czy na tym da się jakoś w miarę sensownie pracować na roboczo, czy też można wdrożyć dobry, wytestowany model sieci do scorowania/segmentowania klientów ?
Maciej Tomaszewski

Maciej Tomaszewski starszy konsultant
CRM, Pivotal Polska

Temat: MS SQL BI i statystyka

Obróbkę wstępną danych i workflow danych nie buduje się tak wygodnie i prosto w Analysis Services jak to jest w dedykowanych pakietach statystycznych np.: StatSoft czy SAS.
Wynika to z faktu, że narzędzia w SQL Serverze są ogólnego przeznaczenia wyrastające z narzędzi ETL i analizy OLAP przeznaczone bardziej dla programistów systemów BI, którzy dopiero z tych klocków budują rozwiązania.
Co do porównywania modeli to jak najbardziej jest to możliwe a korzystanie z gotowego modelu wygląda jak wykonanie zwykłej komenty SQL SELECT z JOIN-em.
Polecam dobry case: http://www.microsoft.com/poland/technet/article/art004...

Następna dyskusja:

Sprytne SQL-ki




Wyślij zaproszenie do