{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ ":::{.content-hidden}\n", "# Visual Exploration\n", ":::\n" ] }, { "cell_type": "code", "execution_count": 1, "metadata": { "id": "cpSH14tMVHzL" }, "outputs": [], "source": [ "import pandas as pd\n", "\n", "# Load the CSV file\n", "memespector_file = \"/content/drive/MyDrive/2024-01-09-Bauernproteste/2024-01-11-Google-Vision-All.csv\"\n", "df = pd.read_csv(memespector_file)\n", "\n", "df = df[['Image_BaseName', 'GV_Label_Descriptions']]\n", "\n", "# Splitting the 'GV_Label_Descriptions' into individual labels\n", "split_labels = df['GV_Label_Descriptions'].str.split(';').apply(pd.Series, 1).stack()\n", "split_labels.index = split_labels.index.droplevel(-1) # to line up with df's index\n", "split_labels.name = 'Label'\n", "\n", "# Joining the split labels with the original dataframe\n", "df_split = df.join(split_labels)\n", "\n", "# Creating a matrix of True/False values for each label per Image_BaseName\n", "matrix = pd.pivot_table(df_split, index='Image_BaseName', columns='Label', aggfunc=lambda x: True, fill_value=False)\n", "\n", "# Resetting the column headers to be the label names only\n", "matrix.columns = [col[1] for col in matrix.columns.values]\n", "\n", "# Now 'matrix' has a single level of column headers with only the label names\n" ] }, { "cell_type": "code", "execution_count": 2, "metadata": { "colab": { "base_uri": "https://localhost:8080/", "height": 455 }, "id": "BdWLaadBbNAD", "outputId": "9b2fbc27-82b1-4b34-e008-fbecf5841b47" }, "outputs": [ { "data": { "text/html": [ "\n", "
\n", " | Adaptation | \n", "Advertising | \n", "Afterglow | \n", "Agricultural machinery | \n", "Agriculture | \n", "Air travel | \n", "Aircraft | \n", "Airliner | \n", "Airplane | \n", "Alloy wheel | \n", "... | \n", "Vertebrate | \n", "Water | \n", "Water resources | \n", "Wheel | \n", "Whiskers | \n", "White | \n", "Window | \n", "Wood | \n", "Working animal | \n", "World | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Image_BaseName | \n", "\n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " |
6750551853789891846.jpg | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "... | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "
6750761577349254405.jpg | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "... | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "
6751467034741067014.jpg | \n", "False | \n", "False | \n", "False | \n", "False | \n", "True | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "... | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "
6763591353164254469.jpg | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "... | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "
6766552734108749062.jpg | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "... | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
7321800737606896928.jpg | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "... | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "
7321804342179204384.jpg | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "... | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "
7321804909290999045.jpg | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "... | \n", "False | \n", "False | \n", "False | \n", "True | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "
7321806774967815457.jpg | \n", "True | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "... | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "
7321806890906701089.jpg | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "... | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "
982 rows × 681 columns
\n", "\n", " | 0 | \n", "1 | \n", "2 | \n", "3 | \n", "4 | \n", "5 | \n", "6 | \n", "7 | \n", "8 | \n", "9 | \n", "... | \n", "232 | \n", "233 | \n", "234 | \n", "235 | \n", "236 | \n", "237 | \n", "238 | \n", "239 | \n", "240 | \n", "241 | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Image_BaseName | \n", "\n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " |
6750551853789891846.jpg | \n", "1.392793 | \n", "-0.851573 | \n", "-0.225060 | \n", "-0.630954 | \n", "0.345822 | \n", "-0.313126 | \n", "0.376667 | \n", "0.370456 | \n", "-0.012519 | \n", "-0.898472 | \n", "... | \n", "-0.007803 | \n", "0.022912 | \n", "-0.002782 | \n", "0.019272 | \n", "-0.005465 | \n", "-0.005129 | \n", "0.011833 | \n", "0.000200 | \n", "0.006499 | \n", "0.010995 | \n", "
6750761577349254405.jpg | \n", "-1.045212 | \n", "0.139963 | \n", "-0.396712 | \n", "0.505531 | \n", "-0.186165 | \n", "0.278001 | \n", "0.860551 | \n", "-0.387782 | \n", "-0.041959 | \n", "0.146992 | \n", "... | \n", "0.020865 | \n", "0.027422 | \n", "0.064993 | \n", "0.046791 | \n", "0.042511 | \n", "-0.040843 | \n", "-0.091713 | \n", "-0.064683 | \n", "0.043392 | \n", "-0.045372 | \n", "
6751467034741067014.jpg | \n", "0.364738 | \n", "0.089808 | \n", "0.603463 | \n", "0.717136 | \n", "0.084382 | \n", "0.130516 | \n", "0.835040 | \n", "0.056190 | \n", "-0.175465 | \n", "-0.551632 | \n", "... | \n", "-0.009497 | \n", "0.144801 | \n", "-0.020713 | \n", "0.035502 | \n", "-0.085562 | \n", "-0.169911 | \n", "0.083582 | \n", "0.045916 | \n", "-0.123521 | \n", "0.032273 | \n", "
6763591353164254469.jpg | \n", "0.657532 | \n", "-0.007257 | \n", "-0.226448 | \n", "-0.142833 | \n", "-0.615043 | \n", "-0.208217 | \n", "-0.082478 | \n", "0.181550 | \n", "0.899774 | \n", "0.462160 | \n", "... | \n", "-0.025889 | \n", "0.006257 | \n", "0.060421 | \n", "0.028564 | \n", "0.045773 | \n", "0.000179 | \n", "0.003499 | \n", "0.027838 | \n", "0.007171 | \n", "-0.051516 | \n", "
6766552734108749062.jpg | \n", "1.638604 | \n", "-0.418596 | \n", "-0.178993 | \n", "-0.522654 | \n", "0.663303 | \n", "-0.186928 | \n", "1.000894 | \n", "-0.307874 | \n", "-0.172688 | \n", "0.336597 | \n", "... | \n", "-0.009052 | \n", "-0.002043 | \n", "0.007575 | \n", "-0.031553 | \n", "0.007831 | \n", "-0.005779 | \n", "-0.023599 | \n", "-0.021165 | \n", "-0.000496 | \n", "-0.006467 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
7321800737606896928.jpg | \n", "-0.698156 | \n", "0.191274 | \n", "-0.529836 | \n", "0.047008 | \n", "0.862388 | \n", "-0.111187 | \n", "-0.390502 | \n", "-0.089231 | \n", "0.144091 | \n", "0.326504 | \n", "... | \n", "-0.015025 | \n", "-0.068188 | \n", "-0.023787 | \n", "0.009343 | \n", "0.004624 | \n", "0.001396 | \n", "0.097441 | \n", "0.145987 | \n", "-0.102992 | \n", "0.110626 | \n", "
7321804342179204384.jpg | \n", "0.032051 | \n", "0.048450 | \n", "0.454149 | \n", "-0.012114 | \n", "0.395014 | \n", "0.128612 | \n", "0.042362 | \n", "1.019634 | \n", "-0.367217 | \n", "1.025644 | \n", "... | \n", "-0.002146 | \n", "-0.042328 | \n", "0.114229 | \n", "-0.066740 | \n", "-0.051395 | \n", "-0.021397 | \n", "0.012134 | \n", "0.046365 | \n", "-0.005712 | \n", "0.036329 | \n", "
7321804909290999045.jpg | \n", "1.005015 | \n", "0.923683 | \n", "0.371054 | \n", "0.533427 | \n", "0.356759 | \n", "0.813597 | \n", "0.087288 | \n", "-0.289707 | \n", "0.377865 | \n", "1.242866 | \n", "... | \n", "0.005721 | \n", "0.000672 | \n", "0.021087 | \n", "0.020260 | \n", "0.037709 | \n", "0.000290 | \n", "0.015725 | \n", "0.013237 | \n", "0.018040 | \n", "-0.002060 | \n", "
7321806774967815457.jpg | \n", "-0.597974 | \n", "0.855850 | \n", "-0.262498 | \n", "-0.214283 | \n", "-0.731812 | \n", "-0.209626 | \n", "-0.179683 | \n", "0.529353 | \n", "-0.239506 | \n", "0.048401 | \n", "... | \n", "-0.012399 | \n", "0.023383 | \n", "-0.073488 | \n", "0.063523 | \n", "0.013320 | \n", "0.020351 | \n", "-0.033865 | \n", "0.029809 | \n", "-0.080413 | \n", "-0.074329 | \n", "
7321806890906701089.jpg | \n", "-0.042383 | \n", "-0.138050 | \n", "0.075564 | \n", "-0.396196 | \n", "0.056236 | \n", "0.612394 | \n", "-0.272538 | \n", "-0.230238 | \n", "-0.379339 | \n", "-0.668773 | \n", "... | \n", "-0.106623 | \n", "-0.214393 | \n", "0.209117 | \n", "0.021869 | \n", "0.220278 | \n", "0.070092 | \n", "-0.198979 | \n", "0.140981 | \n", "-0.004653 | \n", "-0.070667 | \n", "
982 rows × 242 columns
\n", "\n", " | Adaptation | \n", "Advertising | \n", "Afterglow | \n", "Agricultural machinery | \n", "Agriculture | \n", "Air travel | \n", "Aircraft | \n", "Airliner | \n", "Airplane | \n", "Alloy wheel | \n", "... | \n", "Water | \n", "Water resources | \n", "Wheel | \n", "Whiskers | \n", "White | \n", "Window | \n", "Wood | \n", "Working animal | \n", "World | \n", "Cluster | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Image_BaseName | \n", "\n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " | \n", " |
6750551853789891846.jpg | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "... | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "8 | \n", "
6750761577349254405.jpg | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "... | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "2 | \n", "
6751467034741067014.jpg | \n", "False | \n", "False | \n", "False | \n", "False | \n", "True | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "... | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "6 | \n", "
6763591353164254469.jpg | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "... | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "0 | \n", "
6766552734108749062.jpg | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "... | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "False | \n", "8 | \n", "
5 rows × 682 columns
\n", "