
GPT-4o Mini 是 OpenAI 最新推出的小型智能模型,专为高性能和低成本的人工智能解决方案而设计。它支持文本、视觉、音频等多模态输入输出,响应速度极快,适用于实时应用场景。GPT-4o Mini 在数学推理和编码任务上表现出色,并且能够处理大量上下文信息。其价格比之前的模型便宜一个数量级,每百万输入 token 仅需 15 美分,每百万输出 token 60 美分。无论是内容创建、问题解决、复杂数据分析还是代码生成,GPT-4o Mini 都能提供卓越的性能和经济的解决方案。
GPT-4o Mini:OpenAI 最新推出的高效、经济的小型模型
GPT-4o Mini的评测
GPT-4o mini 在文本智能和多模态推理方面的学术基准测试中都超过了 GPT-3.5 Turbo 和其他小型模型,并支持与 GPT-4o 相同的语言范围。它还在函数调用方面表现出强大的性能,这使开发人员能够构建获取数据或使用外部系统执行操作的应用程序,并且与 GPT-3.5 Turbo 相比,它提高了长上下文性能。
GPT-4o mini 已在几个关键基准测试中进行了评估 。
- 推理任务:GPT-4o mini 在涉及文本和视觉的推理任务方面优于其他小型模型,在文本智能和推理基准 MMLU 上得分为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。
- 数学和编码能力:GPT-4o mini 在数学推理和编码任务方面表现出色,优于市场上以前的小型型号。在 MGSM 上,衡量数学推理,GPT-4o mini 得分为 87.0%,而 Gemini Flash 为 75.5%,Claude Haiku 为 71.7%。GPT-4o mini 在衡量编码性能的 HumanEval 上得分为 87.2%,而 Gemini Flash 为 71.5%,Claude Haiku 为 75.9%。
- 多模态推理:GPT-4o mini 在多模态推理评估 MMMU 上也表现出强劲的表现,得分为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。
定价
GPT-4o mini 现在可在 Assistants API、Chat Completions API 和 Batch API 中用作文本和视觉模型。开发人员每 1M 输入令牌支付 15 美分,每 1M 输出令牌支付 60 美分(大约相当于一本标准书中的 2500 页)。我们计划在未来几天内推出 GPT-4o mini 的微调。
在 ChatGPT 中,Free、Plus 和 Team 用户将从今天开始访问 GPT-4o mini,而不是 GPT-3.5。从下周开始,企业用户也可以使用,这符合我们的使命,即让所有人都能享受人工智能的好处。
数据统计
相关导航

Boximator是字节跳动推出的一款利用深度学习技术进行视频合成的先进工具。它使用文本提示和额外的盒子约束来生成丰富且可控制的视频运动,从而为用户创造独特的视频场景提供了灵活的运动控制。具体来说,Boximator可以通过文本精准控制生成视频中人物或物体的动作,能生成包含多个角色以及特定类型运动的复杂场景,并能精确生成物体和背景的细节。

Hyper-SD
Hyper-SD 是字节跳动推出的一种先进图像生成框架,结合了轨迹分段一致性蒸馏(TSCD)和人类反馈学习(RLHF),显著提升了扩散模型在少步骤推理下的图像生成性能。通过 Hyper-SD,用户可以在 1 到 8 步的推理过程中生成高质量的图像,极大地提高了生成速度和效率。

AnimateZero
AnimateZero是腾讯AI团队发布的一款AI视频生成模型,通过改进预训练的视频扩散模型(Video Diffusion Models),能够更精确地控制视频的外观和运动,实现从静态图像到动态视频的无缝转换。

天壤小白大模型
天壤小白是基于语言大模型的AI应用开放平台,无需代码开发,即可快速、灵活地搭建个性化的AI应用。通过提示词工程、语义搜索、向量数据库等各类AI工具组件,破解幻觉难题,为开发者和企业提供一站式的大模型应用服务。覆盖知识管理、市场销售、客户服务、内容生成、辅助决策、多语言翻译等多个场景。

Seed-TTS
Seed-TTS是由字节跳动开发的一系列大规模自回归文本到语音(TTS)模型。它能够生成高度自然、与人类语音几乎无法区分的语音。这个模型特别擅长学习语音上下文、说话人相似度和自然度等方面的特征,从而产生质量极高的语音输出。

CineMaster
CineMaster是一个3D感知和可控的文本到视频生成框架,旨在帮助用户创建高质量的电影视频。该框架通过两个阶段的工作流程,赋予用户专业电影导演般的控制力,允许他们在 3D 空间中精确地放置场景中的对象,并灵活地操控对象和摄像机。

Magi
Magi 的模型是一个可以自动将漫画页转录成文字并生成剧本。该模型通过识别漫画页面上的面板、文字块和角色,实现了全自动的剧本生成功能。

星流图像大模型
星流图像大模型由 LiblibAI 发布的一款自研图像大模型,名为 Star-3 Alpha。该模型基于业界领先的 F.1 基础算法架构训练而成,辅以全球最大的 LORA 增强模型库及不断进化的 AI 图像控制能力。在图像精准度、色彩表现力、美学捕捉的细腻表达等方面实现了显著的飞跃,成为新的业界标杆。
暂无评论...