Back to SQL – o współpracy naukowej GFT i Uniwersytetu im. Adama Mickiewicza w Poznaniu

Arkadiusz Kasprzak i Jakub Kasprzak to #GFTexperts, którzy wiedzą techniczną dzielą się na poziomie akademickim. Współtworzą i prowadzą zajęcia w ramach studiów podyplomowych „Przetwarzanie danych – Big Data” Uniwersytetu im. Adama Mickiewicza w Poznaniu. Wraz z kierownik studiów dr inż. Anną Stachowiak opowiedzieli nam o unikalnym charakterze kursu całkowicie poświęconego bazom danych, a także o roli dydaktyka IT z bogatym doświadczeniem komercyjnym.

Arkadiusz Kasprzak, Anna Stachowiak, Jakub Kasprzak

 

Jaka idea przyświeca studiom „Przetwarzanie danych – Big Data” na UAM?

Anna Stachowiak: Nasz program był bezpośrednią odpowiedzią na zapotrzebowanie rynku pracy, a także na oczekiwania studentów i pracowników, którzy chcą rozwijać się w tej konkretnie dziedzinie. Studia podyplomowe stają się coraz bardziej popularne, bo pozwalają najefektywniej zdobyć konkretną i wyspecjalizowaną wiedzę. Z kolei przetwarzanie danych jest jednym z najdynamiczniej rozwijających się obecnie obszarów, generującym wiele nowych zawodów i miejsc pracy. Nasz Wydział, łączący kompetencje matematyczne i informatyczne, chciał aktywnie włączyć się w jego rozwój, między innymi proponując specjalistyczne studia. Naszym głównym celem było zaoferowanie jak najbardziej praktycznej i aktualnej wiedzy, dlatego zaprosiliśmy do współpracy praktyków i specjalistów z rynku, którzy mieli ogromny wkład przy tworzeniu programu oraz prowadzą tu zajęcia. Chcieliśmy, żeby nasi studenci, poza zdobywaną wiedzą, mieli możliwość nawiązywania ciekawych kontaktów, zadawania pytań i rozmowy ze specjalistami pracującymi w warunkach komercyjnych. Nasz pomysł został doceniony i wyróżniony certyfikatem Studia z przyszłością.

Powiedzcie kilka słów o programie studiów.

Arkadiusz Kasprzak: Na początku warto podkreślić, że są to studia przekrojowe. Tematyka dotyczy przetwarzania danych, ale znajdziemy w niej całe spektrum przedmiotów: od tradycyjnego SQL i hurtowni danych, poprzez optymalizację i analizę danych przy użyciu języka R i Python, aż po strumieniowe przetwarzanie danych za pomocą technologii Big Data i ekosystemu Hadoop. Świetnie odnajdą się tutaj osoby, które chcą się przebranżowić lub dopiero zaczynają swoją przygodę z przetwarzaniem danych, a chciałyby poznać wachlarz możliwości. Dla takich kandydatów te studia są wręcz idealne! Podobnie skorzystają np. analitycy, którzy mają doświadczenie z technologią i pracują z danymi przy użyciu różnych interfejsów.

Natomiast niekoniecznie rekomendowałbym taki kurs osobom, które zafascynowane są tylko jednym obszarem, np. Big Data, i jedynie w nim chciałyby się rozwijać. Program zawiera kilka przedmiotów, które skupiają się na innych aspektach, np. tradycyjnych, relacyjnych bazach i hurtowniach danych.

Przejdźmy do przedmiotów: „Zaawansowany SQL” i „Optymalizacja zapytań”. Czego konkretnie uczycie i w jaki sposób?

Arkadiusz Kasprzak: „Zaawansowany SQL” jest przedmiotem, który ma na celu wprowadzić studentów w świat relacyjnych baz danych. Zakładamy, że uczestnicy mają podstawową wiedzę dotyczącą SQL i same podstawy realizujemy w tempie ekspresowym – tak, aby móc skupić się na ciekawszych konstrukcjach, takich jak wielokrotne grupowanie, zapytania hierarchiczne czy też funkcje analityczne.

Jakub Kasprzak: „Optymalizacja zapytań” to natomiast przedmiot, w ramach którego studenci mają okazję dowiedzieć się w jaki sposób działa silnik bazodanowy (SQL Server) i zrozumieć dlaczego ich zapytania są tak szybkie lub tak powolne. Omawiamy metodykę – jak analizować i rozwiązywać problemy związane z wydajnością oraz obciążeniem serwera bazodanowego. Jest to wiedza przydatna zarówno dla osób analizujących dane (piszących złożone zapytania), jak i w kontekście przetwarzania dużych zbiorów w klasycznych hurtowniach. Okazuje się, że wydajność zapytań SQL to coś, co nurtuje wielu studentów.  A moim celem jest odczarowanie tematu. Jak to w technologii, wszystko ma swoje wytłumaczenie – nie ma cudów!

 

W swoich programach obaj skupiacie się na relacyjnych bazach danych. Czy w świetle nowoczesnych rozwiązań z ostatnich lat, np. z obszaru Big Data, mają one realny potencjał na przyszłość?

Arkadiusz Kasprzak: Mój przedmiot skupia się na SQLu. To według mnie dobry początek w świecie baz danych z uwagi na stosunkowo niski próg wejścia. Relatywnie szybko można zacząć prawdziwą pracę z danymi. Jeżeli chodzi o perspektywy, to wydaje mi się, że jak najbardziej mają potencjał, ponieważ:

  • Samo pojawienie się Big Data czy NoSQL nie wyeliminuje tradycyjnych baz danych. Są to odmienne rozwiązania, które powinny być stosowane do innych problemów (oczywiście mam świadomość, że dzisiaj wszyscy chcą mieć u siebie Big Data, niezależnie od tego, czy tego potrzebują, czy nie – ale to już temat na całkiem inną rozmowę).
  • Nawet przy najnowszych, nierelacyjnych technologiach składowania i przetwarzania danych, producenci różnych narzędzi często dostarczają interfejs „à la SQL”. Wydaje mi się, że dzięki temu dane rozwiązanie staje się bardziej przystępne – przykładowo, analitykowi łatwiej będzie wykonać zapytanie przy użyciu języka zbliżonego do SQL, niż pisać MapReduce’y.

Jakub Kasprzak: Nasze doświadczenia pokazują, że bazy relacyjne są wciąż szeroko stosowane w środowiskach produkcyjnych, nie tylko w dużych korporacjach – istnieje szereg scenariuszy, w których sprawdzają się znakomicie. Także studenci znacznie częściej pracują na co dzień z klasycznymi bazami (nawet jeśli są to jedne z wielu obecnych w danej firmie) niż z technologiami z gatunku Big Data. Wiedza dotycząca „klasyki” jest istotną częścią tematu przetwarzania danych i daje fundament do rozwiązywania wielu problemów. Dlatego uważam, że każdy szanujący się architekt czy analityk danych powinien w swoim zestawie umiejętności znaleźć miejsce na SQL i bazy relacyjne, nawet jeśli skupia się na rozwoju w innych technologiach.

Jesteście praktykami rynku IT, a nie zawodowymi wykładowcami akademickimi. Czy studentów interesuje Wasza praca projektowa w GFT?

Arkadiusz Kasprzak: Jak najbardziej! Studenci pytają o GFT, naszych klientów oraz charakter projektów. Dodatkowo, jak wynika z ankiet, które przeprowadzam na koniec każdej edycji, bardzo cenią anegdoty z życia projektu i różne ciekawostki „od kuchni”.

Jakub Kasprzak : Moim zdaniem jest to właśnie najciekawszy i najbardziej wartościowy aspekt tych studiów – to, co przynosimy z „placu boju”: rzeczywiste sytuacje, scenariusze rozwiązywania konkretnych problemów oraz rzeczy, na które warto zwracać uwagę w pracy komercyjnej. Ujęcie wiedzy i technologii w zupełnym oderwaniu od rzeczywistości rynkowej jest znacznie uboższe niż pokazanie jak ona naprawdę działa, a jeszcze lepiej: kiedy nie działa. Studenci bardzo często pytają jak stosuje się określone techniki czy projekty w dużych organizacjach (w naszym wypadku jest to środowisko dużych banków).

Anna Stachowiak: Zapraszając do współpracy pracowników firm i powierzając im prowadzenie zajęć liczyłam właśnie na to, o czym mówią koledzy – na dyskusje podczas zajęć, omawianie i rozwiązywanie rzeczywistych problemów. Poza tym praktycy prawdopodobnie najlepiej nadążają za zmianami zachodzącymi w ich dziedzinie i są w stanie na bieżąco aktualizować program zajęć. Nasi wykładowcy często mają też pewne doświadczenie dydaktyczne i na pewno potrafią i chcą dzielić się wiedzą.

Prowadzenie zajęć akademickich to dla Was całkiem nowe wyzwanie. Czego nauczyliście się w roli dydaktyków?

Arkadiusz Kasprzak: Rzeczywiście, dla mnie to nietypowe, ale zarazem świetne doświadczenie. Przede wszystkim pozwala usystematyzować wiedzę – jak wiadomo, najlepszym sposobem na ugruntowanie własnej wiedzy jest dzielenie się nią z innymi. Poznajemy też nowych ludzi: rozmawiamy o ich pracy, technologiach i rozwiązaniach, z których korzystają. Często omawiamy problemy, które napotkali w pracy zawodowej. Jeżeli uda się je rozwiązać przy pomocy omawianych na zajęciach konstrukcji, to dla mnie jest to źródło niesamowitej satysfakcji, a dla studentów – dowód realnej użyteczności omawianych tematów.

Jakub Kasprzak: Dla mnie to przede wszystkim kontakt z ludźmi, konfrontowanie własnych doświadczeń z innymi, a czasem wspólne rozwiązywanie ciekawych wyzwań technicznych. Przekrój branż i tematów, z którymi przychodzą studenci, jest naprawdę bardzo obszerny i nierzadko wymaga spojrzenia na pewne świetnie zadomowione technologie z zupełnie innej strony.

Poza tym zgadzam się z Arkiem: praca dydaktyczna to jedna z najlepszych form nauki, jeśli nie najlepsza! Okazuje się, że wyjaśnienie spraw oczywistych nie zawsze jest oczywiste, a na niektóre pytania rodzące się wśród studentów nigdy bym nie wpadł!

Nawiązując do słuchaczy – jaki był dotychczasowy odbiór zajęć?

Anna Stachowiak: Co semestr przeprowadzam ankiety wśród studentów kolejnych edycji. Wynika z nich, że studia te były dobrym wyborem, a wykładowcy są bardzo dobrze oceniani. Zarówno Arek jak Jakub co roku doceniani są za świetny kontakt ze studentami, profesjonalizm i dopracowane materiały. Standardem są komentarze w stylu: “świetne zajęcie, rewelacyjnie merytoryczny prowadzący, super atmosfera”, “bardzo dobrze przygotowany materiał”, “profesjonalizm w każdym calu”. Zdecydowana większość studentów poleciłaby te studia znajomym, co jest najlepszą rekomendacją. Cieszę się, że również prowadzący czerpią z tej pracy przyjemność i satysfakcję :).

Dziękuję za wywiad!