Back to jobs

SENIOR DATA SCIENTIST WITH DATA ENGINEERING SKILLS

Itsg
senior

Job description

Kim jesteśmy? Jesteśmy ITSG - wiodącym dostawcą spersonalizowanych rozwiązań dla wymagających klientów. Wierzymy, że każde wyzwanie ma swoje optymalne rozwiązanie i podchodzimy do niego z pełnym zaangażowaniem. Dostarczamy produkty cyfrowe, stosując nowoczesne rozwiązania i podejście skoncentrowane na wysokiej jakości. O projekcie: Dołączasz do zespołu, który od zera buduje system przewidywania popytu dla jednego z liderów polskiego rynku rozrywki - sieci kilkudziesięciu lokalizacji w całym kraju. System łączy kilkuletnią historię sprzedaży z sygnałami zbieranymi z sieci (trendy wyszukiwań, social media, box office, metadane premier) i przewiduje frekwencję na nadchodzące tytuły, podpowiadając, jak najlepiej ułożyć ofertę w całej sieci. Szukamy Data Scientistów, którzy dobrze czują się nie tylko w analizie i modelowaniu, ale również w praktycznej pracy z danymi na wcześniejszym etapie: ich pozyskiwaniu, czyszczeniu, transformacji oraz przygotowaniu pod dalszą analizę. To rola dla osób, które nie oczekują gotowego, idealnie przygotowanego datasetu i potrafią samodzielnie przejść przez proces od surowych danych do modelu oraz wniosków biznesowych. W projekcie będziesz pracować w ścisłej współpracy z architektem danych oraz zespołem biznesowym. Ważna będzie samodzielność, skrupulatność i gotowość do pracy z nieustrukturyzowanymi oraz niewyczyszczonymi danymi. Zakres obowiązków: • Współpraca z architektem przy projektowaniu relacyjnej bazy danych w SQL; definiowanie schematu, typów danych, relacji i indeksów. • Pozyskiwanie danych z 3-4 źródeł zewnętrznych, w tym stron WWW, API, plików lub baz legacy. • Czyszczenie, transformacja i przygotowanie danych pod analizę oraz modelowanie. • Zasilanie bazy danych przygotowanymi danymi. • Eksploracyjna analiza danych, czyli EDA: identyfikacja zależności, anomalii, braków i problemów jakościowych. • Dokumentowanie wyników analiz oraz założeń dotyczących danych. • Budowa i walidacja modelu ML klasy GLM. • Iteracyjna praca z modelem oraz interpretacja wyników. • Pisanie skryptów w Pythonie do automatyzacji etapów pozyskiwania i przetwarzania danych. • Utrzymywanie porządku w kodzie i dokumentacji: repozytorium, wersjonowanie, powtarzalność wyników. • Przygotowywanie dokumentacji technicznej i analitycznej. • Praca z narzędziami AI wspierającymi development i analizę, m.in. Claude Code, Codex. Wymagania: Doświadczenie i wiedza • Minimum 5-7 lat praktycznego doświadczenia w roli Data Scientist lub pokrewnej. • Bardzo dobra znajomość SQL; projektowanie schematów, zapytania analityczne, optymalizacja. • Bardzo dobra znajomość Pythona w kontekście analizy, przetwarzania i przygotowywania danych. • Umiejętność samodzielnego pisania skryptów do pobierania i przetwarzania danych. • Doświadczenie z bibliotekami/narzędziami takimi jak Pandas, NumPy, BeautifulSoup, Scrapy lub podobnymi. • Doświadczenie z integracją danych z heterogenicznych źródeł, np. REST API, pliki flat, bazy legacy. • Doświadczenie w pracy z niekompletnymi, nieustrukturyzowanymi lub niewyczyszczonymi danymi. • Doświadczenie z eksploracyjną analizą danych. • Doświadczenie z modelami liniowymi / GLM i ich interpretacją. • Umiejętność walidacji modeli predykcyjnych oraz oceny jakości wyników. • Umiejętność samodzielnego postawienia środowiska pracy: Python, baza danych, zależności, repozytorium. Cechy osobowe • Skrupulatność i dbałość o szczegóły; zarówno w danych, jak i w kodzie. • Samodzielność i gotowość do pracy w projekcie, w którym dane nie są idealnie przygotowane. • Umiejętność porządkowania niekompletnych i nieustrukturyzowanych danych. • Bardzo dobra komunikacja. • Umiejętność ustalania wymagań i założeń z ekspertami domenowymi spoza obszaru analiz i technologii. • Dobra znajomość języka angielskiego. Mile widziane: • Znajomość H2O.ai będzie dużym atutem. • Znajomość Jupyter Notebook / JupyterLab. • Znajomość narzędzi do wersjonowania danych lub eksperymentów, np. DVC, MLflow. • Doświadczenie w projektach end-to-end: od pozyskania danych, przez analizę, po model predykcyjny. • Doświadczenie w pracy z narzędziami AI wspierającymi analizę lub development. Oferujemy: • Wynagrodzenie: 160-210 PLN + VAT/h , B2B. • Możliwość wyboru systemu pracy: 100% zdalnie, hybrydowo lub z biura w Warszawie . • Udział w projekcie tworzonym od podstaw: realny wpływ na podejście do danych, strukturę bazy, analizę oraz kierunek modelowania. • Możliwość pracy end-to-end: od pozyskania i uporządkowania danych, przez EDA, aż po model predykcyjny i interpretację wyników dla biznesu. • Pracę i rozwój w wykorzystywanych technologiach: Python, SQL, Pandas, NumPy, GLM, H2O.ai, Jupyter Notebook / JupyterLab, Claude Code, Codex . • Przyjazne środowisko pracy: elastyczny czas pracy, minimalna liczba spotkań. • Benefity: budżet szkoleniowy, lekcje języka angielskiego, karta Multisport, prywatne ubezpieczenie medyczne, imprezy integracyjne. kkuzmicz@itsg.com.pl