GPT-4 Vision, GPT-4 Turbo, GPT-3.5... quel modèle d'OpenAI choisir ?

OpenAI a développé pléthore de versions de ses modèles phares GPT 3.5 et GPT-4. Vitesse, multimodalité, contexte… Quel modèle est le plus adapté à votre cas d'usage ? On fait le point.

16. C'est le nombre de versions différentes de GPT-4 et GPT-3.5 déployées en production par OpenAI. Autant de modèles qui se sont développés depuis la première sortie des LLMs. Avec les mois, l'éditeur de ChatGPT a enrichi ses modèles d'IA avec de nouvelles fonctionnalités plus pratiques les unes que les autres. Un catalogue complet qui s'avère complexe à appréhender aux premiers abords. Pour y voir un peu plus clair, nous détaillons les différentes versions adaptées aux meilleurs cas d'usages.

9 versions différentes de GPT-4 sont déployées au sein de l'API d'OpenAI. Les différences sont principalement de l'ordre des fonctionnalités ou de la performance globale du modèle. Optimisé pour le chat, GPT-4 peut également être utilisé pour des taches de complétions, de code ou de résumé.

GPT-3.5 Turbo est conseillé pour les projets qui nécessitent un traitement de texte peu complexe. Il est optimisé pour le chat et peut également traiter du code avec efficacité. Son utilisation est conseillée pour des cas où la latence de traitement est primordiale. Son coût assez cher par rapport aux derniers modèles du marché (Claude 3 Haiku notamment) en fait un modèle peu attractif. 7 versions différentes sont actuellement proposées par OpenAI.

Quel modèle pour quel usage ?
Version (type)	Code	Tâches complexes	JSON	Multimodal	Tokens de contexte	Data
gpt-4-0125-preview (GPT-4 Turbo)	X	X	X		128 000	déc-23
gpt-4-1106-preview (GPT-4 Turbo)	X	X			128 000	avr-23
gpt-4-1106-vision-preview (GPT-4 Vision)	X	X		X	128 000	avr-23
gpt-4 (GPT-4 (base))	X	X			8 192	sept-21
gpt-4-32k (GPT-4 (32k))	X	X			32 768	sept-21
gpt-3.5-turbo-0125 (GPT-3.5 Turbo)	X		X		16 385	sept-21
gpt-3.5-turbo-1106 (GPT-3.5 Turbo)	X		X		16 385	sept-21
gpt-3.5-turbo-instruct (GPT-3.5 Turbo (chat))					4 096	sept-21
gpt-3.5-turbo-16k (GPT-3.5 Turbo (16k))	X				16 385	sept-21
gpt-3.5-turbo-0613 (GPT-3.5 Turbo)	X				4 096	sept-21
gpt-3.5-turbo-16k-0613 (GPT-3.5 Turbo (16k))	X				16 385	sept-21

GPT-4 Turbo ou GPT-3.5 Turbo ?

OpenAI étant un laboratoire d'innovations en IA, il est déconseillé de baser ses projets long-terme sur l'API développeur de la start-up. Les modèles sont rapidement remplacés et leur durée de support est assez courte (de l'ordre de quelques mois parfois). L'API d'OpenAI peut être utilisée pour lancer des MVP, des poc ou toutes autres types d'expérimentations. Pour passer un projet en production et maximiser sa durabilité, il est conseillé de passer par Azure OpenAI. L'offre de Microsoft, qui repose sur le Cloud Asure, propose la majorité des derniers modèles d'OpenAI dans un environnement sécurisé et flexible.

Quant aux choix entre GPT-4 Turbo et GPT-3.5 Turbo, le plus gros modèle n'est pas toujours le meilleur. Pour des tâches simples de traitement de texte, de résumé, GPT-3.5 peut suffire dans la majorité des cas. En revanche pour des cas d'usage plus complexes, GPT-4 Turbo sera préféré. C'est le cas pour l'analyse ou la génération de code, le traitement de texte complexe ou français ou encore pour le dialogue au sein de chatbot. Des conseils valables jusqu'à l'arrivée de la prochaine famille de modèle attendue d'ici l'été 2024.