汇集您的灵感
让创意和工作流程更加顺畅
242026-04

OpenAI正式发布最新一代大模型GPT-5.5

24日讯,周五凌晨,OpenAI正式发布了最新一代大模型GPT-5.5。Artificial Analysis Intelligence Index(第三方,10项eval加权平均)上,GPT-5.5在同等输出token量下智能得分最高,token总消耗明显低于其他模型。该模型目前已向ChatGPT付费用户开放,更高级别的GPT-5.5 Pro,则向Pro、Business、Enterprise用户开放,API即将上线,价格大幅上涨,为$5/$30(每百万Token),比GPT-5.4翻了三倍。

来源:科创板日报

102026-04

阿里AI视频大模型HappyHorse预计一周后对外发布

要理解HappyHorse的真实水平,需先拆解它在Artificial Analysis(以下简称“AA”)不同榜单上的得分情况。

AA视频竞技场设四大核心赛道:文生视频(无音频)、图生视频(无音频)、文生视频(带音频)、图生视频(带音频)。截至4月9日的最新数据,在纯画质维度,HappyHorse已经建立统治地位;但一旦进入音画融合,它的领先优势并没有那么明显。

在文生视频(无声)赛道,HappyHorse斩获1378分,领先第二名字节跳动Seedance2.0 105 分。在Elo体系中,超过百分的差距意味着用户在盲测中几乎呈现“一边倒”的偏好。而在图生视频(无声)赛道,它跑出的1411分更是刷新了平台历史记录。对于追求极致运镜与画面质感的创作者而言,这匹马目前就是行业天花板。

从知情人士处获悉,HappyHorse已内部上架阿里百炼,预计一周后对外发布。

032026-04

谷歌发布开源模型Gemma 4

当地时间4月2日,谷歌正式推出Gemma 4大模型,据称是迄今为止谷歌最智能的开源模型。谷歌称,Gemma 4基于与“双子座3”(Gemini 3)模型相同的研究和技术体系构建,并对商业使用限制较少。谷歌表示,Gemma 4是其在“相同体量下能力最强”的开源模型。

本次谷歌推出了四种规格的Gemma 4通用模型:高效20亿参数版(E2B)、高效40亿参数版(E4B)、260亿混合专家模型(MoE)与310亿稠密模型(31B)。以适配从移动设备、笔记本电脑到开发工作站和加速器等不同硬件环境。其中较大模型可在个人电脑等设备上支持更高水平的离线推理,小型模型则更侧重于移动端和物联网设备上的低延迟、多模态和离线运行能力。

谷歌表示,Gemma 4模型基于超过140种语言训练,具备多步规划和复杂逻辑推理能力,可用于构建智能体,同时支持代码生成等。

022026-04

阿里发布千问新一代大语言模型Qwen3.6-Plus

4月2日,阿里发布千问新一代大语言模型Qwen3.6-Plus。千问3.6拥有原生多模态理解和推理能力,整体性能大幅增强,在智能体编程SWE-bench系列评测、真实世界智能体任务Claw-Eval等权威评测中,千问3.6编程表现超越2倍乃至3倍参数量的GLM-5、Kimi-K2.5等模型,成为当下编程能力最强的国产模型,接近全球最强编程模型Claude系列。

在前端网页开发、仓库级复杂任务等实测场景中,千问3.6可自主拆解任务、规划路径、测试修改直至任务完成,展现出多模态智能体编程(Agentic Coding)的新突破,让一句话驱动AI写代码的“氛围编程”真正可用。

192026-03

LiblibAI推出AI视频创作产品LibTV

3月18日,LiblibAI宣布推出AI视频创作产品LibTV,该公司表示,用户若使用小龙虾等PersonalAgent,可直接调用LibTV的创作能力。LibTV为一站式AI视频创作平台,采用无限画布加节点式工作流,针对OpenClaw等Agent提供完整Skill包,可理解任务、调用模型、自动生成内容。

https://www.liblib.tv
012026-03

阿里开源桌面智能体工具CoPaw

2026年2月28日,阿里开源桌面Agent工具CoPaw,用户不仅可以一键在本地和云端部署,还可基于CoPaw进行二次开发,自由接入本地模型、编写Skills和接入专属消息应用,满足更定制化的场景需求。基于内置的丰富Skills,CoPaw可帮助用户实现社交平台内容摘要整理、资讯查询和总结、桌面整理等任务。

CoPaw(Co Personal Agent Workstation)是阿里通义实验室推出的桌面Agent(智能体)工具,原生支持钉钉、飞书、QQ、Discord、iMessage 等聊天软件和平台,并内置了文档创建编辑、新闻阅读、文件管理等Skills,可通过阿里云计算巢和魔搭社区创空间实现一键云端部署,并调用千问系列等主流模型。此次CoPaw开源后,开发者可进一步完成定制化改造。

官方地址:https://copaw.agentscope.io/

262026-02

阿里云百炼Coding Plan 首月7.9元,多模型自由切换,且Tokens额度更高

阿里云百炼Coding Plan是什么?Lite和Pro订阅套餐最低7.9元首月攻略,7.9元解锁AI编程,阿里云Coding Plan全解析:百炼AI编码订阅,首月7.9元抄底价,阿里云Coding Plan是什么?Coding Plan是阿里云百炼推出的AI编码套餐,采用固定月费模式,提供月度请求额度,适用于高频编码场景。支持在Qwen Code、Claude Code、Cline、OpenClaw(原Moltbot/Clawdbot)等AI工具中使用,支持Qwen3.5、Qwen3-max、Qwen3-coder、Kimi-k2.5、GLM-4.7等模型。

042026-01

字节跳动新推出的AI agent平台AnyGen,邀请注册,立即体验

字节跳动在海外推出的一款名为AnyGen的AI协作平台,试图向这个黑洞发起挑战。 它没有走“一句话出结果”的老路,而是公然宣称:AI不是为了替代你,而是为了陪你一起,把那些粗糙的想法和零散的碎片,打磨成能直接交给老板的最终成品。字节跳动在海外推出的一款名为AnyGen的AI协作平台,试图向这个黑洞发起挑战。 它没有走“一句话出结果”的老路,而是公然宣称:AI不是为了替代你,而是为了陪你一起,把那些粗糙的想法和零散的碎片,打磨成能直接交给老板的最终成品。

立即体验 AnyGen 全能助手,点击下方链接,用 AnyGen 把重复工作自动化。

特别注意:目前仅支持海外访问,国内访问受限!

https://www.anygen.io/home?invitation_code=03T6ZE4R7M3K1GR

052025-12

阿里推出学习大模型Qwen3-Learning,拍题与作业批改免费不限量

2025年12月4日,阿里巴巴旗下千问APP正式上线基于Qwen3训练的学习大模型——Qwen3-Learning,面向K-12学生及教师提供“拍题答疑+作业批改”双核心功能,且完全免费、不设使用次数上限。官方称,其在多项教育基准中与OpenAI、谷歌付费服务打平,但用户无需订阅即可无限次使用。

202025-11

谷歌发布Gemini 3和Google Antigravity

11月19日消息,据报道,谷歌发布了其最新、最先进的基础模型 Gemini 3,现在可以通过 Gemini 应用和 AI 搜索界面立即使用。这是迄今为止谷歌功能最强大的逻辑线性模型 (LLM),也是市场上最强大的 AI 工具的有力竞争者。据谷歌称,Gemini 应用目前拥有超过 6.5 亿月活跃用户,1300 万软件开发人员已将该模型作为其工作流程的一部分。

除了基础模型之外,谷歌还发布了一款基于 Gemini 的编码界面,名为 Google Antigravity,它支持类似于 Warp 或 Cursor 2.0 等智能 IDE 的多窗格智能编码。具体来说,Antigravity 将 ChatGPT 风格的提示窗口与命令行界面和浏览器窗口相结合,后者可以显示编码代理所做的更改的影响。

132025-10

蚂蚁百灵大模型-蚂蚁开源万亿模型

蚂蚁集团近日推出通用语言模型Ling-1T,该模型为蚂蚁百灵大模型Ling 2.0系列的首款旗舰产品,参数规模达万亿级,是目前团队发布的最大、最强的非思考类大模型。AIME 25 数学推理超越 Gemini-2.5-Pro,效率更高,已在 Hugging Face 开源。依托20T+高质量语料预训练,支持128K上下文窗口,并采用“中训练+后训练”的演进式思维链(Evo-CoT)技术,显著提升推理效率与精度。在AIME 25等复杂数学任务中,Ling-1T以更低Token消耗实现更高准确率,多项指标位居开源模型前列。其在代码生成、逻辑推理及多语种内容创作方面展现卓越泛化能力,初步具备通用智能体特征。团队表示将持续优化注意力架构、智能体交互能力及指令对齐性,推动模型向更高阶通用智能发展。

082025-08

六年来首次,OpenAI开源2款推理模型

当地时间8月5日,OpenAI发布了两款开源模型gpt-oss-120b和gpt-oss-20b。这是自2019年开源GPT-2以来,OpenAI首次发布开源模型。据介绍,gpt-oss-120b总参数量为1170亿,激活参数为51亿,能够在单个H100 GPU上运行,仅需80 GB内存,专为生产环境、通用应用和高推理需求的用例设计,既可以部署在数据中心,也能在高端台式机和笔记本电脑上运行。而gpt-oss-20b总参数量为210亿,激活参数为36亿,专门针对更低延迟、本地化或专业化使用场景优化,仅需16GB内存就能运行,这意味着大多数现代台式机和笔记本电脑都能驾驭。

点评:OpenAI时隔六年再推开源模型,释放技术普惠信号,有望加速AI生态繁荣。

262025-07

字节跳动扣子 Coze 宣布开源:采用 Apache 2.0 许可证,支持商用

7 月 26 日消息,字节跳动旗下 AI Agent 开发平台 —— 扣子(Coze)宣布正式拥抱开源,主要包括两大核心项目,覆盖整个 AI 智能体开发、运维、测试、调优。

Coze Studio(扣子开发平台):https://github.com/coze-dev/coze-studio

Coze Loop(罗盘运维平台):https://github.com/coze-dev/cozeloop

152025-05

OpenAI 官宣:GPT-4.1 免费开放!ChatGPT 用户全体升级!

OpenAI 几小时前的官宣:应广大用户要求,GPT-4.1 从今天起将直接在 ChatGPT 中提供。GPT-4.1 是一款专为 编程任务 和 指令执行 而优化的专用模型。它响应速度更快,是日常编程任务中替代 OpenAI o3 和 o4-mini 模型的绝佳选择。一个是超长上下文:100 万 tokens。在 OpenAI 所有的模型中,它的上下文是最长的;当前也只有谷歌的 Gemini 系列能在上下文方面和它一战。所有用户,可以在 ChatGPT 里使用 GPT-4.1 了!ChatGPT Plus、Pro 和 Team 用户已经可以在 模型选择 -> 更多模型 中选择 GPT-4.1 和 GPT-4.1 mini 进行体验。

302025-04

DeepSeek-Prover-V2-671B 新模型开源发布,专注数学定理证明

DeepSeek 再次掀起开源 AI 领域的热潮,正式发布其最新开源模型 DeepSeek-Prover-V2-671B。这一拥有6710亿参数的超大规模语言模型,专为数学推理和问题解决设计,展现了 DeepSeek 在高效 AI 开发上的持续创新能力。根据社交媒体上的最新讨论,这一模型被认为是 DeepSeek 在数学领域的重要里程碑,或将推动全球 AI 研究与应用的进一步发展。

292025-04

阿里发布Qwen3

4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3,参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。Qwen3是国内首个“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,大大节省算力消耗。

012025-04

OpenAI将发布开源大模型(open-weight)

OpenAI将发布开源大模型(open-weight),新模型的两大特点:开源和强化推理能力,这是自2019年GPT-2之后,OpenAI首次开源语言模型。Sam Altman直言“要让它变得非常、非常优秀”。

262025-03

谷歌继续上新:推理模型2.5 Pro发布,多项测试击败OpenAI和Grok

当地时间3月25日,谷歌宣布推出“最智能的AI模型”Gemini 2.5系列,实验版Gemini 2.5 Pro是该系列上线的首款推理模型。据介绍,实验版Gemini 2.5 Pro是谷歌旗下最先进的复杂任务模型,展示了强大的推理和代码能力,并拥有Gemini系列此前各模型所具有的全部功能。目前,该模型已在Google AI Studio和Gemini应用程序中向Gemini Advanced的订阅用户开放,将很快登陆谷歌模型商店Vertex AI,并在未来几周内宣布公开定价,允许用户进行大规模商用。(澎湃新闻)

DeepSeek宣布V3 模型更新,各项能力全面升级

3月25日晚间消息,DeepSeek宣布V3 模型已完成小版本升级,目前版本号 DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验。DeepSeek-V3-0324 API 接口和使用方式保持不变。如非复杂推理任务,建议使用新版本 V3 模型,即刻享受速度更加流畅、效果全面提升的对话体验。新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

082025-03

阿里开源新模型QwQ-32B,媲美DeepSeek-R1,参数大降20倍!

阿里巴巴开源了最新大模型QwQ-32B,并且支持Apache 2.0 开源协议可以商业化。根据阿里公布的测试数据显示,QwQ-32B在AIME24、LiveCodeBench、LiveBench、IFEval等主流测试基准中,可以媲美DeepSeek开源的R1-671B和OpenAI的o1-mini。但QwQ-32B只有320亿参数,而R1拥有6710亿参数,体量大降了20倍以上。在部署、推理效率、成本方面非常出色。

AI技术研究前沿

我们集合最新的AI技术,研究chatgpt、midjourney等热门的研究成果

登录

找回密码

注册