Marcin Bronicki kierownik, własna
Temat: problem z replikacją danych
Witam,miałem problem, rozwiązałem go dzięki Waszym poradom w wątku "problem z replikacją danych" bo nie do końca jestem zadowolony, nie tyle z odpowiedzi bo wszystko śmiga ile ze względów wydajnościowych.
W skrócie chodzi o to że mam już gotowe agregaty z Oracle, dużo danych, inne środowiska, dane muszą być przenoszone w pliku, która schemat wygląda tak
plec_____kod_pocztowy_ilość
Kobieta____80-201_____122
Mężczyzna__02-545_____283
Kobieta____02_545_____343
...
...
Danych detalicznych kilkanaście milionów, po zrobieniu takiego agregatu to przez wzgląd w ilość kodów pocztowych to i tak jest kilkanaście tysięcy.
Po skorzystaniu z Waszych porad odtwarzam dane jednostkowe. Ale czy jest jednak zostawić w tej postaci np. do regresji liniowej lub logitowej np. przy założeniu że zamiast kodu jest jakiś czas?
Bo jak robię inaczej to te 4 giga które obsługuje R szybko się wyczerpują, muszę pamiętać by usuwać wyniki itp.