Dernière mise à jour le 6 février 2023
Que vous soyez un ingénieur expérimenté en machine learning ou simplement curieux, vous vous demandez peut-être : comment le chat GPT est-il formé ?
Le modèle de langage d’IA, développé par OpenAI, est devenu extrêmement populaire en peu de temps depuis son lancement. À tel point que le site Web rencontre souvent des problèmes de capacité de serveur, empêchant les utilisateurs d’accéder au site.
Le modèle en ligne a la capacité d’effectuer de nombreuses tâches, générant des réponses à presque toutes les invites que vous lui donnez. Mais comment a-t-il été créé ?
Tout d’abord, Chat GPT a été conçu sur la base du GPT-3.5 d’OpenAI. Un autre modèle de langage plus avancé qui a été construit sur un ensemble de données massif, contenant généralement des informations provenant d’Internet.
GPT-3.5 a été affiné pour pouvoir interagir avec ses utilisateurs dans un format conversationnel. Explorons à quoi ressemblait cet ajustement !
Selon OpenAI, Chat GPT a été formé à l’aide de”Reinforcement Learning from Human Commentaires » (RLHF). Initialement, le modèle est passé par un processus appelé ajustement supervisé, où les formateurs OpenAI jouaient à la fois le rôle d’un utilisateur humain et d’un bot d’IA.
A travers cela, les formateurs ont créé une séquence de dialogue afin d’émuler comment les humains communiquent, qui a ensuite été ajouté à l’ensemble de données du modèle pour l’affiner pour des utilisations conversationnelles.
Chat GPT a ensuite été amélioré en créant un modèle de récompense à utiliser pour l’étape suivante : renforcer l’apprentissage. Cela impliquait des formateurs en IA interagissant avec l’outil pour générer des réponses. Ensuite, classez-les du meilleur au pire, en fonction de la qualité.
Avec ces informations, OpenAI pourrait affiner davantage le modèle en utilisant sa propre technique appelée Optimisation de la politique proximale . Si vous recherchez des détails sur ce processus, OpenAI le couvre sur son blog.
Quel type d’apprentissage automatique est Chat GPT ?
Chat GPT d’OpenAI est un modèle de grand langage. Comme leur nom l’indique, ces modèles sont énormes et sont construits à l’aide de milliards de paramètres. Il s’agit d’un type d’algorithme d’apprentissage en profondeur capable de comprendre et de générer du texte, en fonction des données sur lesquelles il a été formé.
Ces types de modèles ont un large éventail d’utilisations allant de la création de chatbots, agissant comme moteur de recherche moteurs et générer du contenu créatif tel que des paroles et des histoires.
Réflexions finales
Comprendre le processus de formation des modèles de langage d’IA, comme ChatGPT, peut être très déroutant. Nous espérons que cet article vous a donné un aperçu de la façon dont OpenAI a créé ce tristement célèbre modèle de langage. Si vous êtes intéressé par d’autres fonctionnalités de Chat GPT, pourquoi ne pas lire Chat GPT Plus-ce que vous devez savoir ensuite ?