Toutiao : le roi de l’agrégateur de contenu en Chine

En utilisant l’apprentissage automatique et approfondi pour créer et servir du contenu, la société chinoise Toutiao a créé un produit dont l’engagement est similaire à celui des réseaux sociaux Plus de 120 millions de personnes en Chine l’utilisent chaque jour. Toutiao n’attribue pas sa croissance à un seul facteur, mais plutôt à l’interaction entre de nombreuses décisions tactiques et stratégiques qu’il a prises dès le lancement ; plus précisément, les avantages clés.

Comment Toutiao a-t-il fait cela ?

Si vous souhaitez en savoir plus, lisez la suite de cet article.

  • Saisir l’opportunité
  • Un effet de réseau de données délibérément construit sur l’ensemble du système
  • La création
  • La distribution
  • La recommendation
  • L’interaction
  • De l’agrégation de contenu à la destination du contenu
  • La Liberté de formats
  • La monétisation précoce et alignement sur le produit
  • La croissance des revenus de Toutiao

I. Toutiao a su saisir l’opportunité

Si le timing est essentiel pour un démarrage, il faut un effort délibéré pour créer une application qui crée une dépendance.

Le timing de Toutiao était fortuit, mais son exploitation de ce moment unique était délibérée.

Toutiao a été lancé alors que l’utilisation des smartphones prenait son envol en Chine.

En outre, nombre des plus grands fournisseurs de contenu n’avaient pas encore développé d’applications mobiles ou de sites adaptés aux téléphones portables, ce qui signifie que les informations et les divertissements véritablement optimisés pour les téléphones portables étaient rares.

À la mi-2012, il n’y avait que six applications d’information importantes sur la plateforme chinoise Android.

Quatre d’entre elles étaient des extensions directes de portails d’information existants avec une optimisation mobile limitée, et les deux autres étaient des agrégateurs qui se basaient exclusivement sur les commentaires lents et impersonnels des éditeurs pour déterminer les articles à montrer.

En outre, la demande de contenu (articles et vidéos) du public chinois était mal satisfaite par les réseaux sociaux chinois tels que WeChat et Weibo.

WeChat a été lancé en tant que messager et dispose à ce jour d’un réseau social fermé (c’est-à-dire que les partage/moments sont réservés aux amis).

Toutiao a comblé cette lacune avec une application mobile facile à utiliser, personnalisée, informative et addictive.

Dès le départ, Toutiao a été extrêmement facile à utiliser, il suffisait de la télécharger.

Le nom de l’application Jinri Toutiao (qui signifie « les gros titres du jour » en chinois) et l’icône de l’application étaient accrocheurs pour les utilisateurs, ce qui a entraîné une excellente croissance du nombre d’utilisateurs.

C’était également la première fois que divers articles d’actualité étaient regroupés en un seul endroit.

Il a atteint 1 million de DAU quatre mois seulement après son lancement.

Toutiao a donné aux nouveaux internautes quelque chose à « faire » lorsque leur temps de communication mobile était encore disponible.

Toutiao a mis à jour l’application presque chaque semaine tout au long de sa première année, car elle a constamment innové, répété et amélioré ses fonctions et ses algorithmes, ce qui a permis d’améliorer la rétention au fil du temps.

Dans les années qui ont suivi, la concurrence pour la part d’attention des utilisateurs sur le mobile a considérablement augmenté, le nombre d’applications mobiles disponibles en Chine a plus que triplé au cours des trois années.

Mais l’avance précoce de Toutiao signifiait qu’au moment où les concurrents arrivaient, il avait déjà un pied important et précieux.

II. Un effet de réseau de données délibérément construit sur l’ensemble du système

Vous pouvez avoir tous les algorithmes du monde, mais sans produit addictif, il n’y a pas de données, et sans données, aucun algorithme ne peut améliorer le système.

En d’autres termes, plus les utilisateurs utilisent votre produit, plus ils fournissent de données.

Plus ils fournissent de données, plus votre produit est intelligent.

Plus votre produit est intelligent (par exemple, meilleure personnalisation, recommandations), mieux il sert vos utilisateurs et ceux-ci sont plus susceptibles de revenir souvent et de fournir plus de données, créant ainsi un cercle vertueux.

En créant un produit qui crée une dépendance, Toutiao génère des données d’engagement de la part de ses utilisateurs.

Ces données sont introduites dans les algorithmes de Toutiao, qui à leur tour affinent la qualité des produits.

En fin de compte, la société prévoit d’utiliser ce cycle vertueux pour optimiser chaque étape de ce qu’elle appelle le « cycle de vie du contenu » : Création, conservation, recommandation et interaction.

III. La création

Depuis l’invention du langage écrit, la création de contenu est le domaine exclusif de l’homme.

Toutiao cherche à changer cela.

Cela a commencé avec Xiaomingbot, une intelligence artificielle qui a déjà publié plus de 8 000 histoires sur la plateforme à ce jour.

En effet, les articles rédigés par les robots ont bénéficié de taux de lecture (nombre de lectures et nombre d’impressions) en ligne avec ceux produits à une vitesse plus lente et à un coût plus élevé par les écrivains humains en moyenne.

Tout d’abord, pour écrire des articles, il fallait disposer de données, et Toutiao les a tirées de trois sources :

a) les mises à jour en temps réel

b) les images d’une société de collecte d’images récemment acquise pour trouver des supports visuels pertinents

c) le suivi des commentaires textuels en direct.

Ensuite, Toutiao a dû trouver comment combiner les données provenant de ces trois sources pour assurer une histoire cohérente et pertinente en interne.

L’équipe d’IA de Toutiao a donc dû intégrer des capacités de traitement du langage naturel à la reconnaissance d’images contextuelles.

Ils ont obtenu une combinaison d’une représentation grammaticale pour générer des modèles de récits, un algorithme de classement pour sélectionner les phrases pertinentes dans les commentaires en direct et un algorithme de correspondance image-texte pour relier le tout.

Le système utilise également des réseaux de neurones pour analyser le contenu des images candidates.

Grâce à une formation sur les données historiques, le modèle est capable de choisir l’image la plus pertinente et la plus attrayante pour l’histoire.

Le système utilise des réseaux neuronaux récurrents pour calculer la représentation vectorielle des phrases et ces vecteurs de phrases sont ensuite intégrés dans un modèle de classement afin de sélectionner des résumés concis pour chaque article.

IV. La distribution

À ses débuts, le Toutiao s’intéressait surtout aux « nouvelles fraîches », c’est-à-dire aux sujets tels que les potins des célébrités, la culture pop et les articles sur le mode de vie.

Contrairement aux informations officielles, qui étaient diffusées par des sources d’information publiques bien connues, les contenus non officiels étaient diffusés sur Internet sur une pléthore de sites individuels.

Toutiao a changé cela.

En possédant, centralisant et optimisant la distribution, il a réduit à presque zéro le temps nécessaire à un utilisateur pour trouver du contenu, et il a augmenté leur confiance dans le fait qu’ils lisaient les histoires les plus intéressantes.

Au fond, la conservation du contenu est un problème à deux facettes : le conservateur doit trouver le contenu, en plus de le servir à ses utilisateurs.

Le premier consiste à visiter les sites web, à identifier les histoires et à collecter les métadonnées pertinentes.

Le second exige la mise à jour permanente d’un dépôt central d’histoires et la création d’autant de versions personnalisées que possible.

Dans les deux cas, il s’agit de tâches à forte intensité de processus où les algorithmes ont un avantage certain sur les humains.

Toutiao a pu rassembler plus de contenu plus rapidement et à moindre coût, ce qui a créé un avantage majeur dans une entreprise où la valeur pour le client est directement liée à la qualité, à la pertinence et au taux de rafraîchissement du contenu.

L’utilisation d’algorithmes signifiait également que chaque utilisateur pouvait avoir son propre profil, basé sur ses intérêts et continuellement mis à jour.

Toutiao utilise également des algorithmes pour identifier et filtrer les contenus de mauvaise qualité.

La qualité d’une plate-forme de distribution de contenu dépend de celle du contenu qu’elle distribue.

Les faux reportages et le spam sont des problèmes majeurs dans l’industrie des médias.

La technologie sous-jacente de Toutiao utilise un algorithme de classification du texte pour déterminer si un article est une fausse nouvelle, s’il utilise des titres « clickbait » ou s’il ne répond pas aux normes de qualité de Toutiao.

Ici, Toutiao s’appuie également sur des modérateurs utilisateurs pour signaler les faux articles et emploie des modérateurs humains pour arbitrer les reportages litigieux.

V. La recommandation

La recommandation de contenu est la caractéristique pour laquelle Toutiao est le plus connu, et à laquelle il doit une grande partie de son succès et de sa réputation.

L’utilisation d’algorithmes d’apprentissage automatique et approfondi à ce stade du cycle de vie du contenu est ce qui a permis à Toutiao de se démarquer de ses pairs, et est la clé de la croissance et de la fidélisation des utilisateurs.

La question que le moteur de recommandation tente de résoudre est simple : quels sont les cent articles que la plateforme peut recommander à chaque utilisateur et qui ont le plus de chances d’entraîner un engagement continu ?

L’équipe d’IA a reconnu que 100 titres est un « seuil » de rétention (les utilisateurs qui ne retiennent pas à long terme ont tendance à diminuer considérablement après avoir vu ~100 titres, semblable à la règle des « 10 amis » de Facebook).

Aussi simple que la question puisse être, la solution est complexe.

Pour chaque nouvel utilisateur, Toutiao mélange les signaux de trois domaines clés pour créer un flux qu’il espère engageant et qui poussera les utilisateurs au-delà du seuil des 100 titres :

Les profils des utilisateurs : ils sont initialement établis sur la base de la compréhension par l’application des caractéristiques démographiques de l’utilisateur (son âge, son lieu, son sexe et son statut socio-économique)

Contenu : pour comprendre le contenu des articles, Toutiao se tourne vers le traitement du langage naturel pour déterminer si l’article est tendance, s’il est long ou court, et l’actualité de l’article (certains articles sont à durée de vie indéterminée tandis que d’autres ont une demi-vie très courte)

Contexte : concerne les données relatives à la localisation (localités comme la géographie, la météo, les nouvelles locales, etc.)

Les algorithmes sous-jacents doivent ensuite identifier la correspondance statistique la plus forte entre le profil de l’utilisateur, son propre profil de contenu et le contexte, et ils doivent le faire en permanence.

Cette correspondance vise à optimiser le pourcentage d’articles lus (sur lesquels l’utilisateur clique) et le pourcentage d’articles terminés.

Lorsqu’un utilisateur ouvre l’application pour la première fois, le système utilise les données de base du profil pour la mise en correspondance : un utilisateur de la Silicon Valley, par exemple, peut être plus enclin à cliquer sur des articles sur la technologie.

Le système s’assure également de montrer une variété d’articles pour évaluer l’intérêt/le désintérêt de l’utilisateur, ce qui peut l’aider à découvrir un contenu jusqu’alors inconnu et à tester ses intérêts potentiels.

Avec le temps, au fur et à mesure que l’application collecte des informations sur les utilisateurs, ces recommandations s’affinent de plus en plus.

Le moteur apprend rapidement, pour la plupart des utilisateurs, il faut moins d’une journée pour connaître avec succès leurs intérêts (indiqué par un taux de lecture de 80 %).

Il en résulte un fort taux de rétention des utilisateurs (>45 %), similaire à celui des réseaux sociaux, et l’un des temps les plus longs passés par les applications utilisateur dans le monde.

VI. L’interaction

Avec la croissance de Toutiao, l’interaction sur la plateforme est devenue de plus en plus centrale dans sa proposition de valeur pour l’utilisateur.

Plutôt que de laisser aux utilisateurs le soin de se trouver les uns les autres, Toutiao utilise des algorithmes sous-jacents pour permettre des connexions significatives.

Cela n’est nulle part plus pertinent que dans sa fonction de questions-réponses récemment développée, où l’équipe d’IA a été chargée de développer un moteur de correspondance qui relie un demandeur à une personne qui peut lui répondre.

Toutiao a récemment publié un article pour la conférence ACL vantant ces résultats.

L’approche qu’ils proposent, intitulée « Conditional Focused Neural Question Answering with Large-Scale Knowledge Bases », atteint une précision de 75,7 % sur un ensemble de données de 108 000 questions, et dépasse l’état actuel de la technique (meilleure que les méthodes Memory Network et LTG-CNN sur l’ensemble de données de référence) par une marge de 11,8 %.

VII. De l’agrégation de contenu à la destination du contenu

Il n’est pas rare de voir des applications s’efforcer de passer de l’agrégation de contenu à la destination du contenu.

Cependant, il est extrêmement difficile de mettre en place une stratégie de marque et de création pour y parvenir.

Voici comment Toutiao y est parvenu.

Toutiao a offert deux avantages significatifs aux contributeurs de contenu sur les plateformes.

De fortes incitations via le partage des revenus qui ont permis aux auteurs de gagner de l’argent dès le début.

En 2014, Toutiao a mis en place des programmes d’incitation pour attirer davantage de créateurs de contenu sur la plateforme.

Ces mesures allaient de l’offre de bureaux, d’outils, de garanties minimales par mois s’ils atteignaient certaines étapes clés (par exemple, nombre d’articles, taux de lecture) au partage des revenus via la monétisation.

Toutiao a commencé à monétiser par le biais d’annonces depuis 2014, ce qui a permis de partager les revenus avec ses contributeurs de contenu.

C’est cette fonction qui a lancé Toutiao, mais au fur et à mesure de sa croissance, Toutiao est devenu une plateforme plus profonde pour la génération de contenu, la consommation et les connexions.

Aujourd’hui, elle héberge plus de 800 000 comptes Toutiao, des médias professionnels, des blogueurs et des influenceurs qui utilisent la plateforme pour partager des articles, des images et des vidéos avec les utilisateurs de Toutiao .

Elle accueille beaucoup plus d’utilisateurs qui partagent de courts messages par l’intermédiaire de Wei Toutiao.

Les 20 premières catégories ne représentent que 60 % de l’offre de contenu et aucune catégorie ne contribue à elle seule à plus de 10 % du contenu.

VIII. La Liberté de formats

Au lieu de s’obstiner sur leur format de base (par exemple, les listes, les contenus longs et les nouvelles), Toutiao a rapidement étendu son offre à d’autres formats lorsque les données le suggéraient.

En 2015, au moment où la plupart des plateformes vidéo en Chine se concentrent sur les vidéos longues, Toutiao a ajouté une capacité vidéo et a commencé à prendre en charge le contenu vidéo court du PGC (généralement 1-5 minutes) sur sa plateforme.

Toutiao avait observé une augmentation de l’offre de contenu vidéo en 2014, la connectivité et l’infrastructure s’étant considérablement améliorées à cette date.

En outre, Toutiao a déployé plusieurs programmes d’incitation pour promouvoir la création de contenu vidéo sur sa plateforme.

Plus tard, en mars 2016, Toutiao a lancé Toutiao Video (qui est maintenant rebaptisé Watermelon Video), une courte application vidéo distincte du PGC utilisant le même moteur d’algorithme que Toutiao.

Comme pour le contenu écrit, les algorithmes sous-jacents recommandent aux utilisateurs les vidéos les plus pertinentes en fonction de leur graphe d’intérêt.

Toutiao est désormais la « plate-forme de référence » pour les contenus vidéo courts du PGC.

IX. La monétisation précoce et alignement sur le produit

Toutiao a atteint un niveau de revenus sans précédent en peu de temps et il est remarquable qu’elle le fasse sans s’appuyer sur un graphique social ou un historique d’achat de produits.

Toutiao est en passe de dépasser les 15 milliards de RMB (>2,2 milliards de dollars US) de revenus cette année.

X. La croissance des revenus de Toutiao

Parmi les nombreuses choses que fait Toutiao, il y a un élément qui est au cœur de son modèle plus que tout autre : il est bon pour identifier ce que ses utilisateurs veulent voir.

Toutiao génère des revenus en associant des publicités pertinentes aux utilisateurs, en utilisant la même technologie propriétaire pour le ciblage du contenu.

Cela présente trois avantages importants :

  • Premièrement, elle a réduit l’impact de la monétisation sur l’expérience de l’utilisateur, et a peut-être même amélioré l’expérience !

En diffusant des publicités qui sont très pertinentes par rapport aux intérêts de l’utilisateur, Toutiao agit à bien des égards comme un mécanisme de découverte de produits.

  • La seconde est qu’il a augmenté les tarifs que Toutiao pourrait faire payer aux annonceurs.

L’un des principaux problèmes en matière de publicité est de déterminer comment placer sélectivement ses annonces devant les clients potentiels les plus importants, et les annonceurs passent d’innombrables heures et dépensent des sommes énormes pour essayer de cibler efficacement.

La technologie de Toutiao, qui résout ce problème de ciblage de manière native, représentait une solution et permettait aux annonceurs de ne pas payer un prix élevé pour cela.

  • Troisièmement, comme le principal cas d’utilisation est la lecture et la visualisation de contenu, les utilisateurs sont plus réceptifs à la vision de publicités ciblées pertinentes et les annonceurs disposent donc d’un plus grand inventaire.

La combinaison de ces trois facteurs permet d’obtenir de bien meilleurs CTR (Click Through Rates) sur Toutiao par rapport à ses concurrents.

Selon les données d’une enquête réalisée par un tiers, les taux de clics de Toutiao sont 200 % plus élevés que ceux de ses concurrents.

En conclusion

Toutiao est en train d’atteindre son objectif final, qui est essentiellement d’effacer le concept de recherche et de ne servir que des contenus agrégés et hyper pertinents.

GMA Agence de communication en Chine

On vous aide, regardez notre site avec nos études de cas.

Laissez le premier commentaire