SENIOR DATA SCIENTIST WITH DATA ENGINEERING SKILLS
Itsg
senior
Job description
Kim jesteśmy?
Jesteśmy ITSG - wiodącym dostawcą spersonalizowanych rozwiązań dla wymagających klientów. Wierzymy, że każde wyzwanie ma swoje optymalne rozwiązanie i podchodzimy do niego z pełnym zaangażowaniem. Dostarczamy produkty cyfrowe, stosując nowoczesne rozwiązania i podejście skoncentrowane na wysokiej jakości.
O projekcie:
Dołączasz do zespołu, który od zera buduje system przewidywania popytu dla jednego z liderów polskiego rynku rozrywki - sieci kilkudziesięciu lokalizacji w całym kraju. System łączy kilkuletnią historię sprzedaży z sygnałami zbieranymi z sieci (trendy wyszukiwań, social media, box office, metadane premier) i przewiduje frekwencję na nadchodzące tytuły, podpowiadając, jak najlepiej ułożyć ofertę w całej sieci.
Szukamy Data Scientistów, którzy dobrze czują się nie tylko w analizie i modelowaniu, ale również w praktycznej pracy z danymi na wcześniejszym etapie: ich pozyskiwaniu, czyszczeniu, transformacji oraz przygotowaniu pod dalszą analizę. To rola dla osób, które nie oczekują gotowego, idealnie przygotowanego datasetu i potrafią samodzielnie przejść przez proces od surowych danych do modelu oraz wniosków biznesowych.
W projekcie będziesz pracować w ścisłej współpracy z architektem danych oraz zespołem biznesowym. Ważna będzie samodzielność, skrupulatność i gotowość do pracy z nieustrukturyzowanymi oraz niewyczyszczonymi danymi.
Zakres obowiązków:
• Współpraca z architektem przy projektowaniu relacyjnej bazy danych w SQL; definiowanie schematu, typów danych, relacji i indeksów.
• Pozyskiwanie danych z 3-4 źródeł zewnętrznych, w tym stron WWW, API, plików lub baz legacy.
• Czyszczenie, transformacja i przygotowanie danych pod analizę oraz modelowanie.
• Zasilanie bazy danych przygotowanymi danymi.
• Eksploracyjna analiza danych, czyli EDA: identyfikacja zależności, anomalii, braków i problemów jakościowych.
• Dokumentowanie wyników analiz oraz założeń dotyczących danych.
• Budowa i walidacja modelu ML klasy GLM.
• Iteracyjna praca z modelem oraz interpretacja wyników.
• Pisanie skryptów w Pythonie do automatyzacji etapów pozyskiwania i przetwarzania danych.
• Utrzymywanie porządku w kodzie i dokumentacji: repozytorium, wersjonowanie, powtarzalność wyników.
• Przygotowywanie dokumentacji technicznej i analitycznej.
• Praca z narzędziami AI wspierającymi development i analizę, m.in. Claude Code, Codex.
Wymagania:
Doświadczenie i wiedza
• Minimum 5-7 lat praktycznego doświadczenia w roli Data Scientist lub pokrewnej.
• Bardzo dobra znajomość SQL; projektowanie schematów, zapytania analityczne, optymalizacja.
• Bardzo dobra znajomość Pythona w kontekście analizy, przetwarzania i przygotowywania danych.
• Umiejętność samodzielnego pisania skryptów do pobierania i przetwarzania danych.
• Doświadczenie z bibliotekami/narzędziami takimi jak Pandas, NumPy, BeautifulSoup, Scrapy lub podobnymi.
• Doświadczenie z integracją danych z heterogenicznych źródeł, np. REST API, pliki flat, bazy legacy.
• Doświadczenie w pracy z niekompletnymi, nieustrukturyzowanymi lub niewyczyszczonymi danymi.
• Doświadczenie z eksploracyjną analizą danych.
• Doświadczenie z modelami liniowymi / GLM i ich interpretacją.
• Umiejętność walidacji modeli predykcyjnych oraz oceny jakości wyników.
• Umiejętność samodzielnego postawienia środowiska pracy: Python, baza danych, zależności, repozytorium.
Cechy osobowe
• Skrupulatność i dbałość o szczegóły; zarówno w danych, jak i w kodzie.
• Samodzielność i gotowość do pracy w projekcie, w którym dane nie są idealnie przygotowane.
• Umiejętność porządkowania niekompletnych i nieustrukturyzowanych danych.
• Bardzo dobra komunikacja.
• Umiejętność ustalania wymagań i założeń z ekspertami domenowymi spoza obszaru analiz i technologii.
• Dobra znajomość języka angielskiego.
Mile widziane:
• Znajomość H2O.ai będzie dużym atutem.
• Znajomość Jupyter Notebook / JupyterLab.
• Znajomość narzędzi do wersjonowania danych lub eksperymentów, np. DVC, MLflow.
• Doświadczenie w projektach end-to-end: od pozyskania danych, przez analizę, po model predykcyjny.
• Doświadczenie w pracy z narzędziami AI wspierającymi analizę lub development.
Oferujemy:
• Wynagrodzenie: 160-210 PLN + VAT/h , B2B.
• Możliwość wyboru systemu pracy: 100% zdalnie, hybrydowo lub z biura w Warszawie .
• Udział w projekcie tworzonym od podstaw: realny wpływ na podejście do danych, strukturę bazy, analizę oraz kierunek modelowania.
• Możliwość pracy end-to-end: od pozyskania i uporządkowania danych, przez EDA, aż po model predykcyjny i interpretację wyników dla biznesu.
• Pracę i rozwój w wykorzystywanych technologiach: Python, SQL, Pandas, NumPy, GLM, H2O.ai, Jupyter Notebook / JupyterLab, Claude Code, Codex .
• Przyjazne środowisko pracy: elastyczny czas pracy, minimalna liczba spotkań.
• Benefity: budżet szkoleniowy, lekcje języka angielskiego, karta Multisport, prywatne ubezpieczenie medyczne, imprezy integracyjne.
kkuzmicz@itsg.com.pl