Aplikacja jest przedstawieniem analizy języka, jakim posługują się polscy politycy na Twitterze z podziałem na następujące frakcje polityczne:

- PiS

- KO (Koalicja Obywatelska)

- Lewica

- Konfederacja

- PSL-Kukiz


Do przeprowadzenia analizy użyty został algorytm word2vec z bilioteki Gensim po wcześniejszej lematyzacji przy użyciu słownika języka polskiego Morfeusz 2. Zasada działania jest relatywnie prosta i polega na przypisywaniu słowom występującym w tekście wielowymiarowych wektorów w zależności od ich częstotliwości występowania względem siebie. Algorytm został stworzony z myślą o grupowaniu słów mających podobne znaczenie, ale przy odpowiednich parametrach uczenia można na znaleźć słowa, które występują w podobnych kontekstach. Tweety członków każdej z frakcji zostały przeanalizowane oddzielnie co pozwala dostrzec wyraźne różnice w sposobie mówienia na różne tematy. Wyniki zostały przedstawione na trzy sposoby:

- Most Similar - przedstawienie słów najbardziej podobnych do słowa zadanego, innymi słowy słów leżących najbliżej w przestrzeni wielowymiarowej. Pozwala to zobrazować w jakich kontekstach najczęściej jest używane dane słowo. Najlepsze wyniki zwraca dla słów o nacechowaniu politycznym.

- Word Map - mapa przedstawiająca wybrane słowa na przestrzeni dwuwymiarowej po wcześniejszym zredukowaniu liczby wymiarów.

- Tweet Generator - pokazuje jak mógłby wyglądać tweet dla danej partii biorąc pod uwagę jedno z najbliżej leżących słów do poprzednich