Marcin S.

Marcin S. Niezależny
konsultant i
wykładowca

Temat: Jak sprawdzić, czy dysponujemy wystarczającą ilością...

Trzyczęściową odpowiedź na to pytanie znajdą Państwo tu:
http://blog.sqlexpert.pl/tag/data-assessment/

konto usunięte

Temat: Jak sprawdzić, czy dysponujemy wystarczającą ilością...

Panie Marcinie, Zdaje sie, ze jest Pan autorem ksiazki, ktora zakupilem :)

Mam pytanie nawiazujace do tematu watku. Chodzi o regresje logistyczna na SQLu. Czy sa jakies metody over/under -samplingu ? Mam probke danych ok. 350 000 rekordow, przy czym tych gdzie event wystapil jest mniej niz 1%. SAS pozwala na zrobienie samplingu: http://support.sas.com/kb/24/205.html
Marcin S.

Marcin S. Niezależny
konsultant i
wykładowca

Temat: Jak sprawdzić, czy dysponujemy wystarczającą ilością...

Miło mi :)
SQL Server to właśnie serwer, nie gotowy program, ale są dwa rozwiązania:
1. Z użyciem dodatku DM dla Excel - tam jest funkcja oversampling, 350 tys rekordów to ilość dająca się jeszcze przetwarzać w Excelu
2. Z użyciem własnych zapytań. Można np. założyć widok który wybierze wszytki rekordy z eventem a potem (UNION ALL) dobierze X losowych rekordów z pozostałych. Ale najlepiej będzie skopiować (w ten sam sposób) rekordy do nowej tabeli.

Następna dyskusja:

poszukiwany analityk danych




Wyślij zaproszenie do