Pytanie:
Wybory absolwentów w dziedzinie nauki o danych?
user60305
2014-11-12 04:18:32 UTC
view on stackexchange narkive permalink

Obecnie kończę studia B.S. Doktor nauk matematycznych i chciałby podjąć studia podyplomowe (na początek tytuł magistra, z możliwością zrobienia doktoratu) z myślą o wejściu w obszar nauk o danych. Interesuję się także uczeniem maszynowym.

Jakie wybory absolwentów doprowadziłyby mnie do miejsca, w którym chcę się udać?

Czy istnieje konsensus co do tego, czy absolwent dyplom z matematyki stosowanej, statystyki lub informatyki dałby mi lepszą pozycję do wejścia w dziedzinę nauki o danych?

Dziękuję wszystkim za pomoc, to jest dla mnie duży wybór i każdy wkład jest bardzo cenione. Zwykle zadaję pytania na Mathematics Stack Exchange, ale pomyślałem, że zadawanie ich tutaj da mi szerszą i lepiej zaokrągloną perspektywę.

Możesz wypróbować wymianę stosu nauki danych dla tego Q.
@JeremyMiles: To świetny pomysł. Niedawno się tam dołączyłem, więc spróbuję.
Pięć odpowiedzi:
Frank Harrell
2014-11-12 05:29:47 UTC
view on stackexchange narkive permalink

Jeśli zdobędziesz MS w statystykach stosowanych (po którym być może otrzymasz tytuł doktora) i będziesz miał bardzo dobre przygotowanie komputerowe, nie pomylisz się. MS lub doktorat z biostatystyki prowadzi do świetnych miejsc pracy, a jeśli nie lubisz badań biomedycznych lub farmaceutycznych, nadal kwalifikujesz się do niemedycznej dziedziny związanej ze statystykami stosowanymi.

Dzięki za tę radę.Od twojego postu rozglądałem się bardziej po wydziałach biostatystyki, a jednym, który jest szczególnie atrakcyjny, jest program biostatystyki prowadzony przez Indiana University na IUPUI (ponieważ można go ukończyć w niepełnym wymiarze godzin i mogłem zdobyć doświadczenie zawodowe podczas uczęszczania).Czy wiele statystyk / biostatystyki jest doktoratem?programy oferują opcję uczestnictwa w niepełnym wymiarze godzin, czy jest to względna rzadkość?
Z tego co wiem, jest to rzadkie.
StasK
2014-11-12 10:41:25 UTC
view on stackexchange narkive permalink

Mrożąca krew w żyłach rzeczywistość jest taka, że ​​ statystycy nie są uznawani za naukowców zajmujących się danymi. Tak więc zdobycie dyplomu ze statystyki z pewnością dobrze wyposaży cię w naukę o danych, ale możesz nie mieć tak wielu możliwości, jak mogłoby się wydawać, że sugerowałaby to nazwa kierunku.

Nie mam puszki odpowiada za Ciebie (i nikt tego nie robi ... z wyjątkiem Hala Variana, a możesz chcieć porozmawiać z nim bezpośrednio - jeśli nie możesz wygooglować jego danych kontaktowych, nie powinieneś rozważać kariery w data science :)). Moje dwa centy, które powinieneś rozważyć, to:

  1. Program informatyczny z drobną specjalizacją w statystykach. Moim zdaniem stopień informatyczny jako taki nie wyposaży cię dobrze w naukę o danych, ponieważ statystyka w artykule „nauka o danych bez statystyk” polega na tym, że naukowcy zajmujący się danymi ostatecznie wymyślają statystyki na nowo. Dlatego lepiej będzie Ci się go dobrze nauczyć na początku.
  2. Profesjonalny program magisterski z zakresu analityki ( Rutgers, stan NC - nie to Popieram je, podam tylko przykłady). programy Professional Science Master obejmują około 60% godzin zaliczeń z programu nauczania przedmiotów ścisłych i około 40% z programu biznesowego. Żałuję, że nie miałem możliwości podjęcia tego stopnia, gdy byłem w szkole średniej. Oczywiście zakłada się, że cię na to stać - możesz iść do większości doktorantów. programów i uzyskaj pełne wsparcie finansowe, ale za studia magisterskie będziesz musiał zapłacić samodzielnie.

Przeglądaj Academia.SE, aby uzyskać więcej wskazówek dotyczących struktury Twoje szkolenie podyplomowe i jakiego stopnia możesz chcieć lub nie. Co ciekawe, Data Science.SE jest obecnie (listopad 2014 r.) W fazie beta i nie jest to dobra, zdrowa wersja beta.

Dlaczego nie ma wzmianki o ekonomii, @stask?
OP zapytał o [jakąś] * naukę *.Ekonomia nie jest * nauką * ... chociaż na pewno jest to dobrze płatne zajęcie :)
Wydaje mi się zbyt surowe stwierdzenie, że „ekonomia nie jest nauką”.Z pewnością zgadzam się jednak, że niektóre dziedziny ekonomii są mniej naukowe niż inne.
+1 za oba Twoje punkty.Wielu moich współpracowników przeszło przez program NC State.Dodam, że informatyka M.S.w programie, który wymaga uczenia maszynowego, byłby również dobrym rozwiązaniem - zakładając, że OP jest dość biegły w programowaniu, którego i tak będzie potrzebował, aby zostać „Data Scientist”.Myślę, że stronniczość statystyków polega na stereotypie, że są bardziej teoretyczni lub używają Stata itp. Do pracy nad problemami na mniejszą skalę.Jeśli chodzi o ekonomię, to muszę powiedzieć, że moimi ulubionymi blogerami statystycznymi są ekonomiści.
Wayne, zabawne jest stwierdzenie, że statystycy używają Stata.R jest lepiej przystosowany do pracy z danymi o dziwnych strukturach, a SAS może odczytywać i zapisywać ogromne zbiory danych bez żadnych modyfikacji składni, ale Stata nie jest gorszym narzędziem niż te dwa.Jestem jednak stronniczy, chociaż myślałem, że to oczywiste w moich postach.gung, biorąc pod uwagę strukturę rewolucji naukowych Kuhna, biorąc pod uwagę ilość debat ekonomicznych, nie do końca ukształtowała się jako nauka.
@Wayne: dziś i historycznie zarówno SAS, jak i R / S-PLUS były znacznie bardziej popularne wśród statystyk niż Stata (sam jestem użytkownikiem Stata).Język S, z którego wywodzą się R i S-PLUS, był prawie niespotykany poza kręgami statystycznymi, ale stał się obecnie niezwykle popularny (R).Niestety, istnieje ogromne zniekształcenie tego, co robią statystycy, nie mówiąc już o narzędziach, których używają.
@StasK: Bardzo lubię Stata - kupiłem go w zeszłym roku - i nie chciałem krytykować go ani jego użytkowników.Myślę, że jest bardziej popularny wśród ekonomistów niż statystyków.Chodziło mi o to, że stereotyp wykluczający „Statystykę” z „Nauki o danych” to przekonanie, że nauka o danych dotyczy dużych zbiorów danych (Hadoop, ogromny SQL itp.), Które często są dowolne (eksploracja tekstuitp.) i wymaga zespołów Data Scientists, podczas gdy statystycy pracują niezależnie nad eksperymentami itp. To oczywiście stereotyp.
Prezentacja Terry Speed na temat Big Data pomaga rzucić trochę światła na wiele zniekształceń i stereotypów: http://vimeo.com/91502942
Aaron Zeng
2014-11-12 09:16:07 UTC
view on stackexchange narkive permalink

EDYCJA: Po prostu spróbuj dodać więcej słów.

Jako doktorant z biostatystyki czuję się świetnie z tym, co powiedział @ Frank-Harrell. I to się zgadza !!! Studenci z naszego wydziału mają świetne miejsca pracy po ukończeniu studiów.

Z drugiej strony @StasK zacytował artykuł „ Czy nie jesteśmy nauką o danych?”, ale zatytułował go „ statystycy nie są rozpoznawani jako naukowcy danych ”. Jest to dla mnie nieco mylące. Statystycy mogą nie być nazywani naukowcami danych. Ale kto jeszcze może formalnie to twierdzić? W każdym razie artykuł stwierdza, przynajmniej dla mnie, że statystyki mogą wnieść ogromny wkład w naukę o danych. Głównym problemem, który utrudnia statystykom promowanie nauki o danych, jest to, że pracownicy statystyki nie są dobrze wyszkoleni w zakresie obliczeń na dużą skalę i wydajnego programowania. Cytowany z tego artykułu jest następujący.

Oraz statystyki. Statystyka ma ogromny potencjał, aby przyczynić się do nauki o danych. Istnieją otwarte problemy badawcze wymagające, aby klasyczne metody statystyczne w próbkowaniu, projektowaniu i wnioskach przyczynowych były „skalowane w górę”, aby były wykonalne z ogromnymi zbiorami danych. Niewielu informatyków i innych, którzy dominują w środowisku nauki o danych, jest dobrze zorientowanych w tych koncepcjach, a wielu przyjmuje „algorytmiczne” podejście do analizy danych. Nauka o danych wymaga myślenia statystycznego i nowych fundamentalnych ram - na przykład, jaka jest „populacja”, gdy mamy do czynienia z Big Data generowanymi przez Google?

W rzeczywistości wiele firm zaczyna gromadzić dane prospektywnie do testów wewnętrznych i walidacji, a nie docenia się mocy zasad projektowania. Statystycy mogliby napędzać znaczne postępy poprzez opracowanie „eksperymentalnego projektu na miarę XXI wieku”!

Można z pewnością powiedzieć, że nauki komputerowe są na lepszej pozycji, ale brakuje im po prostu myślenia statystycznego. Ale dla mnie uważam dwa główne elementy za „mózg” i „ręce”! Jeśli projekt eksperymentu jest błędny na samym początku lub jeśli wnioskowanie jest tendencyjne na samym końcu, skończymy z zupełnie inną historią o wnioskach i strategii biznesowej.

Upraszczając, wszystko, co chciałbym tutaj przekazać, praktykujący naukę o danych naprawdę potrzebują zarówno dobrego myślenia statystycznego, jak i programowania.

KONIEC EDYCJI:

Aby zdecydować, na jakim stopniu chcesz się rozwijać, musisz zdobyć aby wiedzieć, jakie zestawy umiejętności kwalifikują Cię do pracy w dziedzinie nauki o danych. Opierając się na tym, co wiem, jeśli chcesz wejść w dziedzinę nauki o danych, jakie „twarde” umiejętności , które chciałbyś mieć, są zasadniczo dwojakie: silne zdolności analityczne oraz dobre obliczenia i programowanie umiejętności. Możesz przejść do Quora i wyszukać takie hasła, jak „nauka o danych”, „naukowiec danych” itp., Aby dowiedzieć się, jak wygląda ta dziedzina i co należy do niej przygotować. Oto dwa pytania od Quora, przez które możesz chcieć odpowiedzieć:

  1. Co to jest nauka o danych?
  2. Jak zostać analitykiem danych?

W przypadku niektórych takich pytań, rozumiesz.

( Umiejętności miękkie , takie jak ustne i umiejętności komunikacji pisemnej i umiejętności pracy w zespole są również bardzo ważne. A w niektórych okolicznościach nawet ważniejsze niż umiejętności analityczne. Ale z pewnością dyskusja na temat umiejętności miękkich jest z pewnością poza tematem ze względu na twoje pytania.)

A teraz wracając do pytań.

Jakie wybory absolwentów zaprowadziłyby mnie tam, gdzie chcę się udać?

Gdy już uzyskasz jasną wizję i głęboko przemyślisz to, czego musisz się nauczyć, powinieneś być w stanie samodzielnie odpowiedzieć na to pytanie. Moją sugestią byłyby nauki komputerowe, matematyka stosowana lub statystyka, biostatystyka, fizyka, inżynieria lub jakiekolwiek inne kierunki, które w dużym stopniu obejmują analitykę i obliczenia. Zasadniczo, interdyscyplinarny stopień naukowy, który pomoże ci trenować zarówno analizę danych, jak i programowanie, z pewnością zapewni ci świetną pozycję do pracy w dziedzinie nauki o danych.

Czy istnieje konsensus co do tego, czy dyplom ukończenia studiów jest stosowany? matematyka lub statystyka postawiłyby mnie w lepszej pozycji do wejścia w dziedzinę nauki o danych?

Nie wiem, czy istnieje taki konsensus formalnie uznany przez naukowców akademickich lub praktyków przemysłowych, ale ja może przekazać Ci wiadomości / raporty ze stron internetowych, które pokazują, jaką rolę odegra Statystyka w miarę ewolucji „Ery Big Data”. Wierzę, że te artykuły przynajmniej utwierdzą Cię w przekonaniu, że statystyki powinny być dobrym wyborem.

  1. Dla dzisiejszego absolwenta, tylko jedno słowo: statystyki
  2. Jak nauka statystyczna może przyspieszyć projekty badawcze związane z dużymi zbiorami danych?
  3. Odkrycie z danymi: wykorzystanie statystyki z informatyką do transformacji nauki i społeczeństwa
  4. We Are Data Science
  5. [The Era of Big Data] Artykuły o Big Data, które trzeba przeczytać

Ostatni pochodzi z mojego bloga, w którym zebrałem kilka ważnych artykułów z mediów i znanych stron internetowych, takich jak NYTimes, Forbes, McKinsey, Harvard Business Review itp. Możesz znaleźć takie, które zarysowują przyszłość dziedziny data science, i umiejętności potrzebne w tej dziedzinie. Na przykład, oto cytat z NYTimes, słowa Hala Variana.

„Wciąż powtarzam, że seksowną pracą w ciągu najbliższych 10 lat będą statystycy” - powiedział Hal Varian, główny ekonomista w Google. „I nie żartuję”.

Większość artykułów opisuje to, że dziedzina statystyki jako dyscyplina badająca dane - „nauka o danych” przeżywa rozkwit w tym historycznym momencie. Więc jeśli istnieje konsensus, te artykuły byłyby tego oznaką.

Wreszcie, ponieważ może ci się wydawać, że przekonuję cię do uzyskania tytułu magistra statystyki lub biostatystyki, nie mają taki zamiar, chociaż są to świetne wybory, jak wskazałem wcześniej. Wszelkie stopnie naukowe, które pasują do twoich zainteresowań (np. Uczenie maszynowe w informatyce), warto wziąć pod uwagę, o ile wiesz, że przygotowujesz swoje umiejętności analityczne i obliczeniowe. Możesz nawet nauczyć się tych umiejętności samodzielnie, korzystając z kursów otwartych na Coursera.

(+1) Absolwentów fizyki lub inżynierii z pewnością nie należy zniechęcać do studiowania nauki o danych, ale nie jestem pewien, czy zaliczałbym czytanie tych przedmiotów do najbardziej bezpośrednich ścieżek dla kogoś, kto * wyrusza * nato.
+1 Zwróć uwagę, że stwierdzenie „Jeśli istnieje, głównym problemem utrudniającym statystykom promowanie nauki o danych jest to, że ludzie ze statystyki nie są dobrze wyszkoleni w zakresie obliczeń na dużą skalę i wydajnego programowania” zawiera niejawne założenie, że nauka o danych = duże zbiory danych.Twierdziłbym, że wiele (większości?) Problemów nie jest w stanie wygenerować danych miliardowych lub zwiększona wielkość próby - która zbyt często jest zdezorientowana dla populacji - w niewielkim stopniu przyczynia się do rozwiązania problemu i może faktycznie utrudniać analitykowi wykrywaniesygnał.
Dobre punkty, @ThomasSpeidel.W rzeczywistości wiele problemów naukowych lub przemysłowych dotyczy niewielkiej próby, jak eksperymenty w firmach farmaceutycznych i wiele innych, które wymagają ludzi jako przedmiotów.W takich sytuacjach zdecydowanie mniej przydatne są techniki „dużych zbiorów danych”.Rozwój Big Data jest tak naprawdę wynikiem rewolucji mobilnego internetu i mediów społecznościowych w Internecie.W związku z tym większość aplikacji Big Data jest powiązanych z obszarem IT.Dlatego ludzie z informatyki dominują obecnie w tak zwanej erze dużych zbiorów danych.
Randy Bartlett
2014-11-15 22:57:19 UTC
view on stackexchange narkive permalink

Jeśli masz już licencjat z matematyki i chcesz analizować dane w tej dziedzinie, to magister statystyki zrobi znacznie więcej niż drugi stopień z matematyki. Tylko statystyka, biostat i OR (nie tak pewne) uczą podstawowych założeń statystycznych dotyczących problemów statystycznych. Statystyka już teraz uczy więcej matematyki, niż potrzeba do analizy danych, np. Teorii miary i teorii dużych próbek.

Ponadto statystyczne uczenie maszynowe jest mocno zakorzenione w statystyce. Są to narzędzia w ML, których używamy do analizy danych. Pozostałe narzędzia służą do zarządzania danymi.

Nisha Dhiman
2019-07-15 14:23:11 UTC
view on stackexchange narkive permalink

Wybierz PG w nauce o danych.Jest to dostępne głównie na uniwersytetach w USA iw Europie.Wiem, że robią się naprawdę drogie.Dlaczego więc nie pójdziesz na studia podyplomowe online w dziedzinie nauk o danych i inżynierii, które będą obejmować uczenie maszynowe.Mam jedno na myśli: Świetna nauka - PG w nauce i inżynierii danych



To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 3.0, w ramach której jest rozpowszechniana.
Loading...