Dec 10, 2018 Last Updated 12:12 PM, Dec 6, 2018

Data-science, kwalitatief onderzoek en de smaak van frisdrank

Verbinden van gegevensbronnen leidt tot betere insights. Insights-afdelingen staan onder druk. Meer dan ooit verwacht men dat ze snellere, goedkopere en effectievere inzichten leveren. Maar kan het ook anders? In plaats van beter en sneller onderzoek, kunnen insights-afdelingen ook naar bestaande gegevensbronnen kijken en vaak zijn die kwalitatief.

Tekst Wim Hamaekers (Haystack) en Sjoerd Koornstra (the House of Insights)

Bedrijven beschikken over veel waardevolle gegevens zonder zich bewust te zijn van het volledige potentieel. Bovendien zijn relevante databases vaak publiek beschikbaar via API's of worden ze verkocht via databrokers. De grootste barrière ligt in het begrijpen van de overvloed aan gegevens. Bedrijven worstelen met het verbinden van verschillende bronnen door verschillende datastructuren, ontbrekende waarden en de complexiteit van datasets. De laatste jaren zijn er enorme vorderingen gemaakt in machine learning en data science. De meerwaarde zit echter in het slim inzetten van de beschikbare methoden. Zo kan kwalitatief onderzoek data science-technieken ondersteunen en verrijken. We laten een case study zien in de drankenindustrie, waarin bestaande gegevensbronnen zijn gebruikt en waar de combinatie met kwalitatief onderzoek geleid heeft tot het blootleggen van een verborgen laag van inzichten.

Smaak

Een belangrijke onderzoeksvraag voor veel bedrijven in de drankensector is: welke smaken moet je lanceren op welke markten? In de praktijk lanceren merken meestal één basisvariant, samen met twee of drie smaken. Dan volgt marktonderzoek om de smaken met het meeste potentieel te identificeren. Maar deze uitgebreide onderzoeken kosten tijd en geld. Bovendien zijn sommige markten te klein of onderontwikkeld om onderzoeksbudget aan te besteden. Een ander probleem is dat in consumentenonderzoek smaken vaak werden afgewezen door consumenten. Gezien het feit dat de validatiefase bij consumenten pas in een laat stadium van de ontwikkeling van innovaties komt, wordt dat als een verspilling van geld en middelen beschouwd.

Het doel van dit project was of we uit de data van het verleden – in combinatie met beschikbare databases van smaakinnovaties – iets konden leren waarmee er in het begin van het ontwikkelingsproces gerichter ontwikkeld kon worden. Het einddoel was een tool die het mogelijk zou maken om vooraf bepaalde smaken te screenen en hun potentieel in een bepaalde markt te bepalen aan het begin van het product-innovatieproces. We begonnen met het zoeken naar gegevensbronnen die al beschikbaar waren bij de klant of beschikbaar bij externe dataleveranciers. We detecteerden de volgende bronnen:

  1. Gegevensbronnen voor andere dranken
    We hebben gekeken naar categorieën die vooroplopen met betrekking tot nieuwe smaken. Toonaangevende categorieën zijn volgens ons kauwgom, thee en frisdranken. Een van onze databrokers had een frisdrankdatabase. Die bevatte meer dan 500 smaakcombinaties op categorieniveau (niet op merkniveau), uit bijna 100 landen, over een aantal opeenvolgende jaren. De smaak kan een individuele smaak zijn, bijvoorbeeld appel of limoen, maar ook een smaakcombinatie van die twee. De volgende hypotheses werden aangenomen:
    • Smaken met een hoog verkoopvolume duiden op een hoger potentieel;
    • Sterke groei (versus afname) van een bepaalde smaak of smaakcombinatie gedurende twee opeenvolgende jaren duidt op trend of smaken die erg populair zijn.
  2. Smaakintroducties dranken
    Dit betreft een database die bestaat uit een groot aantal nieuwe smaakintroducties in een bepaald land. In totaal bevatte de database 50 nieuwe smaakintroducties per land in 73 landen. De hypothese is dat een verhoogd aantal introducties van een bepaalde smaak in een bepaald land duidt op een hoger volumepotentieel.
  3. Interne verkoopdata
    Deze gegevensbron bevatte het verkoop-volume van verschillende smaken in bijna 100 markten in twee opeenvolgende jaren. Deze database geeft het succes en het relatieve belang aan van smaken in de markt.
  4. Motivationeel onderzoek
    Gebaseerd op kwalitatieve motivationele studies werden 10 motivationele positioneringsplatforms gedetecteerd. Ook werd een inschatting gemaakt van de rol die verschillende smaken spelen op de verschillende positioneringsplatformen.
  5. Ad hoc-consumentenonderzoek naar smaak
    Een belangrijke onderbenutte gegevens-bron was het groot aantal consumentenonderzoeken naar de aantrekkelijkheid en voorkeur van verschillende smaken en smaakcombinaties. In totaal beschikten wij over een database over 25 landen met per land zo’n 50 geteste smaken en combinaties. Zo telden we vijf verschillende gegevens-bronnen die ingezet konden worden om meer dan 500 smaak- en smaakcombinaties per markt op potentie te voorspellen. De gegevens werden in vijf opeenvolgende stappen gestructureerd:
    • Stap 1 Categoriseren van smaken
      Als eerste stap werden elk van smaakcombinaties uit de gegevensset geclassificeerd in 20 hoofdcategorieën. Dit werd gedaan door sensorische experts. Een smaakcombinatie kan aan meer dan één categorie worden toegewezen (bijvoorbeeld appel/limoen valt zowel in de appel- als in de citrus-categorie).
    • Stap 2 Toewijzen van smaken aan motivaties
      Elk van de smaakcombinaties werd toegewezen aan motivationele platformen. Een smaakcombinatie kon worden toegewezen aan meer dan één positioneringsplatform. Deze toewijzingsprocedure gebruikte als input de smaakcategorisatie zoals beschreven in stap 1.
    • Stap 3 Berekening van nieuwe smaakintroducties
      Voor elk van de smaken hebben we gekeken naar de hoeveelheid nieuwe introducties van die smaak in elk land. Voor smaakcombinaties hebben we het gemiddelde berekend van nieuwe introducties van elke smaak afzonderlijk.
    • Stap 4 Verrijken van de database van aroma-aantrekkelijkheid en voorkeur
      Elk van de smaken kreeg een score op basis van de resultaten van de consumentenvoorkeur. Deze score varieerde van 0% tot 100%.
    • Stap 5 Frisdrank-volumegegevens en interne sales data toevoegen
    • De frisdrankvolumes en hun absolute groei werden toegevoegd aan de dataset. Dat gold ook voor de interne verkoopdata.

Frisdrankvolume

In totaal bestond de volledige database uit 49 kenmerken, en elk land had meer dan 500 regels (rijen) in de database, gegeven de informatie uit de verschillende smaken (één rij per smaak).
We wilden het potentieel voor elke smaak in elk land voorspellen. De dataset bestond echter uit ontbrekende variabelen, waardoor het onmogelijk was om een potentiële score te geven voor elke smaak in elk land. Dat is de reden waarom een methode is ontwikkeld om de ontbrekende variabelen te schatten. Niet alle frisdranksmaken zijn in alle landen op de markt. We wilden echter het potentiële frisdrankvolume van een bepaalde smaak voorspellen wanneer het in een bepaald land op de markt zou zijn. Om de genoemde ontbrekende waarden toe te rekenen, hebben we vervolgens een voorspellend algoritme (machine learning-methode) gebruikt om onze gegevens te extrapoleren naar onbekende markten. Deze voorspellende tool is een methodologie die een oplossing biedt voor complexe onvolledige gegevensproblemen. De methode zoekt naar patronen in de volledige dataset (over alle opgenomen parameters: land, positioneringsplatformen, smaakcategorieën, smaakvoorkeur, enz.) en voorspelt de ontbrekende waarde, gebaseerd op overeenkomsten met andere waarnemingen. De motivationele positioneringsplatformen spelen bij deze patroonherkenning een onmisbare rol.

Het uiteindelijke smaakpotentieel is samengesteld uit een score variërend van 0 tot 100 (de kans op potentieel succes). We hebben onze database ondergebracht in een gebruiksvriendelijke tool. Met deze tool kunnen managers gemakkelijk de kans op succes inschatten voor bepaalde smaken in een bepaalde markt en kunnen ze beslissen over het potentiële smaakportfolio.

Verbinden

De toepassing leverde een overvloed aan inzichten op. In totaal geeft de applicatie inzichten over bijna 50.000 producten. Het verzamelen van vergelijkbare resultaten met traditionele onderzoeksmethoden zou makkelijk meer dan 100 miljoen euro kunnen kosten en jaren veldwerk in beslag nemen. De tool is van enorme waarde voor het bepalen van de prioriteiten van R&D-projecten. Daarnaast wordt ze veel gebruikt door business managers om smaakinnovaties gerichter te doen. De case laat zien dat insights-afdelingen enorm kunnen profiteren van het verbinden van bestaande gegevens- bronnen, waarbij kwalitatief onderzoek een belangrijke en onmisbare ondersteunende rol vervult. Door gebruik te maken van wat al bekend is, kunnen bedrijven sneller en meer agile reageren op wat nodig is om te voldoen aan de huidige business-eisen. «

Dit artikel is overgenomen uit Clou magazine© nr 90, december 2018.