搜索结果
关键词 开源,共 24

腾讯开源 Hy-MT 翻译模型:440MB 实现离线运行,性能超越谷歌翻译

腾讯开源 Hy-MT 翻译模型:440MB 实现离线运行,性能超越谷歌翻译 腾讯近日正式开源紧凑型 AI 翻译模型 Hy-MT1.5-1.8B-1.25bit。该公司声称,该模型在保持高性能的同时,可在智能手机上实现完全离线运行。目前,该模型支持包括中、英、德、法、日、藏、蒙在内的33种语言及5种方言,涵盖1056个翻译方向,并在国际机器翻译大赛中累计斩获...

#AI#开源#硬件
3 天前

OpenAI 新模型系统指令泄露,GPT-5.5 竟被禁止谈论“哥布林”?

OpenAI 新模型系统指令泄露,GPT-5.5 竟被禁止谈论“哥布林”? 近日,随着 OpenAI 旗下 Codex CLI 代码的最新开源,关于下一代 AI 模型 GPT-5.5 的部分底层运行逻辑浮出水面。据科技媒体 Ars Technica 披露,在泄露的系统提示词(System Prompt)中,出现了一项极为罕见的指令:严禁模型在没有明确关联的...

#AI#开源
4 天前

OpenAI系统提示词遭泄露,新模型GPT-5. 5 严禁讨论“哥布林”

OpenAI系统提示词遭泄露,新模型GPT-5. 5 严禁讨论“哥布林” 科技媒体Ars Technica于 4 月 30 日发布的一则报道引发了AI圈的广泛关注。在最新开源的Codex CLI代码中,OpenAI旗下GPT-5. 5 模型的系统提示词意外曝光,其中包含一条极为古怪的指令:严禁在对话中谈论“哥布林”及“小精灵”等幻想生物神秘禁令防范AI陷入...

#AI#产品#开源
4 天前

押注于人而非代码:Zig 项目全面禁止 LLM 辅助贡献引发热议

押注于人而非代码:Zig 项目全面禁止 LLM 辅助贡献引发热议 在生成式 AI 席卷编程领域的当下,知名开源项目 Zig 近期采取了一项“逆流而上”的严格政策:全面禁止使用大语言模型(LLM)生成的代码或评论参与项目贡献。这一决策由知名开发者 Simon Willison 深度解读后,迅速在开源社区引发了关于技术效率与人才培养之间博弈的广泛讨论。核心矛盾...

#AI#开源
4 天前

蚂蚁集团正式开源万亿级大模型Ling-2.6-1T,主打“快思考”智效比提升

蚂蚁集团正式开源万亿级大模型Ling-2.6-1T,主打“快思考”智效比提升 蚂蚁集团旗下的百灵大模型团队于今日宣布,正式向开发者开源其万亿级旗舰模型Ling-2.6-1T。该模型不盲目追求参数规模的堆叠,而是致力于在真实复杂任务中,系统性地优化模型的指令执行、工具适配及长上下文承接能力。架构创新实现高效能“快思考”机制Ling-2.6-1T采用了创新的混...

#AI#产品#开源
5 天前

蚂蚁百灵 Ling-2.6-1T 正式开源:万亿参数规模对标 GPT-5.4

蚂蚁百灵 Ling-2.6-1T 正式开源:万亿参数规模对标 GPT-5.4 蚂蚁百灵大模型(Ling)今日宣布,其万亿参数级旗舰模型 Ling-2.6-1T 正式开源。该模型延续了上周发布时的技术核心,不再盲目追求超长思考链或参数规模冗余,而是通过创新的 MLA 与 LinearAttention 混合架构实现“快思考(Fast-Thinking)”机制...

#AI#产品#开源
5 天前

腾讯开源超轻量离线翻译模型,手机端运行仅需0.4GB内存

腾讯开源超轻量离线翻译模型,手机端运行仅需0.4GB内存 4月29日,腾讯混元团队宣布正式开源其极限量化压缩版的翻译模型——Hy-MT1.5-1.8B-1.25bit。这款模型最大的亮点在于,它将支持33种语言的翻译能力精准压缩到了440MB左右,这意味着即便是存储空间紧凑的移动设备,也能在完全不联网的状态下实现高质量的实时翻译。极致压缩:手机内存的“减负...

#AI#产品#开源
5 天前

智效比提升十倍:蚂蚁集团百灵大模型Ling-2.6-flash正式开源

智效比提升十倍:蚂蚁集团百灵大模型Ling-2.6-flash正式开源 蚂蚁集团旗下的百灵大模型今日宣布,正式开源其最新成员Ling-2.6-flash。该模型同步推出了BF16、FP8、INT4 等多个量化版本,旨在为全球开发者提供更灵活的硬件适配选择,进一步降低AI部署的门槛。作为一款高性能模型,Ling-2.6-flash的总参数量达104B,其中激...

#AI#产品#开源
6 天前

商汤科技开源日日新 SenseNova U1,实现多模态原生统一架构

商汤科技开源日日新 SenseNova U1,实现多模态原生统一架构 商汤科技于 28日正式发布并开源日日新 SenseNova U1系列原生理解生成统一模型。该模型基于商汤今年3月自主研发的 NEO-unify 架构,在单一模型框架下实现了多模态理解、推理与生成的深度统一,标志着多模态 AI 范式从“集成式”向“原生统一”的重大跨越。SenseNova...

#AI#产品#开源
6 天前

商汤发布原生理解生成统一模型 SenseNova U1 告别插件式AI

商汤发布原生理解生成统一模型 SenseNova U1 告别插件式AI 国产人工智能领域再次迎来技术性突破。 4 月 28 日晚间,商汤科技正式向外界展示并开源了其最新研发成果——“日日新SenseNova U1”系列。这一系列被定义为“原生理解生成统一模型”,其核心价值在于打破了以往多模态模型依赖于不同模块“拼接”的传统思路。摒弃“拼接”逻辑,实现架构统...

#AI#产品#开源
6 天前

蚂蚁集团百灵大模型系列更新 Ling-2.6-flash正式开源

蚂蚁集团百灵大模型系列更新 Ling-2.6-flash正式开源 蚂蚁集团旗下的百灵大模型系列于今日迎来重要更新,Ling-2.6-flash正式向全球开发者开放。为了适配差异化的硬件环境并降低部署门槛,该模型同步推出了 BF16、FP8以及 INT4等多个精度版本,旨在为开发者提供更具弹性的推理选择。作为一款总参数量达到104B、激活参数量为7.4B 的...

#AI#产品#开源
6 天前

爆火的DeepSeek-V4 背后:北大开源框架One-Eval如何终结AI测评“噩梦”?

爆火的DeepSeek-V4 背后:北大开源框架One-Eval如何终结AI测评“噩梦”? DeepSeek-V4 发布仅 10 小时,北京大学DCAI团队便火速出炉了一份全量自动化评测报告。这一速度在AI工程界引发了广泛关注,其核心推手是北大最新开源的评测框架——One-Eval。长期以来,大模型评测被视为工程师的“噩梦”。传统流程中,从筛选基准集、编写...

#AI#产品#开源
7 天前

DeepSeek V4 中文大模型评测:再创国内第一辉煌!

DeepSeek V4 中文大模型评测:再创国内第一辉煌! 在最新发布的 DeepSeek V4中文大模型测评中,SuperCLUE 团队的结果显示,DeepSeek-V4-Pro 以其卓越的综合表现重新夺回国内第一的位置,而 Flash 版本则紧随其后位居第二。这一成就标志着国产开源模型在技术上的又一次突破。本次测评涵盖了数学推理、科学推理、代码生成、智...

#AI#产品#开源
7 天前

百度发布GenFlow4.0:Office Agent全面升级,月活用户突破1亿

百度发布GenFlow4.0:Office Agent全面升级,月活用户突破1亿 4月27日,百度在AI Day开放日上正式发布通用智能体GenFlow4.0,并对Office Agent进行全面升级,标志着百度文库与网盘联手打造出首个全端可用的“AI工作台”。GenFlow4.0深度兼容OpenClaw等开源框架,支持个人与团队用户在PC及移动端一键部署...

#AI#产品#开源
8 天前

OpenAI 推出 Privacy Filter:全新 PII 脱敏模型开源上线

OpenAI 推出 Privacy Filter:全新 PII 脱敏模型开源上线 近日,OpenAI 发布了一款名为 Privacy Filter 的新模型,旨在帮助开发者有效脱敏文本中的个人身份信息(PII)。该模型的参数规模达到了 1.5 亿,采用了混合专家(MoE)设计,并以 Apache 2.0 协议在 Hugging Face 和 GitHub...

#AI#产品#开源
8 天前

告别信息泄露!OpenAI 推出 Privacy Filter,支持12.8万超长上下文与8类隐私识别

告别信息泄露!OpenAI 推出 Privacy Filter,支持12.8万超长上下文与8类隐私识别  OpenAI 近日宣布推出一款前沿的个人身份信息(PII)脱敏模型——Privacy Filter。该模型目前已通过 Apache2.0协议在 Hugging Face 和 GitHub 同步开源,旨在为开发者提供一个可本地运行、支持高度定制的隐私保护...

#AI#开源#云计算
8 天前

​腾讯推出具身多模态大模型 HY-Embodied-0.5-X,赋能机器人智能交互

​腾讯推出具身多模态大模型 HY-Embodied-0.5-X,赋能机器人智能交互 近日,腾讯 Robotics X 实验室与混元团队共同发布并开源了 HY-Embodied-0.5-X,这是一款专为具身任务优化的多模态大模型,旨在提升机器人在真实环境中的智能交互能力。该模型基于 HY-Embodied-0.5-MoT-2B 架构,强调机器人在 “看懂、想...

#AI#产品#开源
8 天前

亚毫米级精准对位:小米开源 VLA 大模型后训练全流程

亚毫米级精准对位:小米开源 VLA 大模型后训练全流程 小米近期宣布正式开源其视觉-语言-动作(VLA)大模型 Xiaomi-Robotics-0的真机后训练全流程。这一举措标志着小米在具身智能领域迈出重要一步,旨在让机器人能够更快速地通过少量数据掌握复杂的操作技能。二十小时练就“穿针引线”基于预训练基座,研发团队仅利用约20小时的任务数据进行真机后训练...

#AI#开源
8 天前

ComfyUI完成3000万美元融资:估值达5亿美元,用户数突破400万

ComfyUI完成3000万美元融资:估值达5亿美元,用户数突破400万 4月24日,由开源项目演进的AI初创公司ComfyUI宣布完成3000万美元融资,公司估值达到5亿美元。本轮融资由Craft Ventures领投,Pace Capital、Chemistry及TruArrow跟投。作为基于节点的工作流平台,ComfyUI通过模块化框架解决了主流扩散...

#AI#开源#投融资
8 天前

OpenClaw发布新版本:DeepSeek V4Flash正式成为系统默认模型

OpenClaw发布新版本:DeepSeek V4Flash正式成为系统默认模型 近日,全球知名开源Agent框架OpenClaw发布v2026.4.24版本,宣布正式接入DeepSeek V4系列模型,并将其轻量化版本DeepSeek V4Flash设为系统默认大脑。作为拥有25万余GitHub星标的顶尖开发框架,OpenClaw此次“易主”标志着中国开...

#AI#产品#开源
8 天前

小米开源VLA大模型后训练全流程,机器人亚毫米级操作成现实

小米开源VLA大模型后训练全流程,机器人亚毫米级操作成现实 小米在机器人技术领域再次抛出“重磅炸弹”。继今年2月发布并开源其VLA大模型Xiaomi-Robotics-0后,小米于今日正式公布了该模型的真机后训练(Post-training)全流程。这一举措旨在解决机器人从实验室走向实际生产的“最后一公里”问题,让AI机器人真正成为开箱即用的生产力工具。在...

#AI#产品#开源
8 天前

DeepSeek-V4 发布!性能直逼顶级闭源模型,百万上下文 1 元起

DeepSeek-V4 发布!性能直逼顶级闭源模型,百万上下文 1 元起 北京时间4月24日,DeepSeek 正式推出新一代大模型 DeepSeek-V4,其整体性能已达到比肩当前顶级闭源模型的水平,成为开源 AI 领域又一里程碑式产品。超长100万上下文窗口DeepSeek-V4支持高达100万 tokens 的超长上下文,为复杂长文档分析、超长代码生...

#AI#产品#开源
10 天前

寒武纪成功适配 DeepSeek-V4,推动 AI 模型高效运行

寒武纪成功适配 DeepSeek-V4,推动 AI 模型高效运行 寒武纪公司宣布,他们已成功完成对深度求索公司最新开源 AI 模型 DeepSeek-V4 的 Day 0 适配。此举意味着该模型在发布当天即可实现稳定运行,为用户带来了更高效的人工智能体验。寒武纪利用其自主研发的高性能融合算子库 Torch-MLU-Ops,对模型中的 Compressor、...

#AI#产品#开源
10 天前

寒武纪宣布实现 DeepSeek-V4全系列模型 Day0适配并开源优化代码

寒武纪宣布实现 DeepSeek-V4全系列模型 Day0适配并开源优化代码 寒武纪今日宣布,已基于 vLLM 推理框架完成对深度求索(DeepSeek)最新开源模型DeepSeek-V4全系列的“Day0”适配。此次改装涵盖285B 参数的 Flash 版本及1.6T 参数的 Pro 版本,确保模型在发布当日即可在寒武纪硬件平台上稳定运行,相关改装代码已...

#AI#产品#开源
10 天前