AI日报 - 2025年04月26日
🌟 今日概览(60秒速览)
▎🤖 模型竞赛 | OpenAI与Google新模型在Arena榜单激烈角逐,性能指标各有千秋。
OpenAI发布o3/o4-mini等新模型,Gemini 2.5 Pro紧随其后,数学、编程能力成焦点。
▎💼 商业动向 | 并购与合作加速AI落地,Aleph Alpha收购Thingsthinking,Perplexity携手摩托罗拉。
AI编码助手、安全领域融资活跃,显示资本持续看好特定赛道。
▎🔬 技术前沿 | 多模态、模型架构、训练优化成研究热点,原生多模态预训练受关注。
从MoE架构、并行推理到量化技术,研究者持续探索提升LLM效率与能力的新路径。
▎💡 应用创新 | AI深入内容创作、审核、开发辅助等场景,效率提升显著。
Webtoon利用AI减少70%审核工作量,AI编程助手降低语言门槛,AI工具展现非平凡实用性。
▎🗣️ 行业观点 | AI训练价值回归,生态系统认为APIs非万能;对齐、伦理、开发者接纳度引热议。
Andrew Ng看好AI降低编程门槛,Richard Sutton提出对齐新思路,训练数据的价值被重申。
🔥 一、今日热点 (Hot Topic)
1.1 OpenAI与Google新模型Arena榜单争锋,多款轻量级模型亮相
#模型发布 #性能评测 #OpenAI #Google #Arena | 影响指数:★★★★★
📌 核心进展:OpenAI发布GPT-4.1系列及o3、o4-mini模型,在LMArena排行榜表现突出。o3与Google Gemini 2.5 Pro在风格控制、数学、编程等类别并列第一。o4-mini首次进入前十,数学能力超越o1。同时,GPT-4.1在硬提示、数学等类别进入前五。这些新模型旨在提供比GPT-4o/4.5更具性价比的高性能方案,尤其在编码和推理上。
⚡ Gemini 2.5 Pro在数学严谨性方面获认可,OpenAI则因高成本退役GPT-4.5 API。Arena榜单正测试新设计。
💡 行业影响:
▸ 模型竞争白热化,性能与成本效益成为关键差异化因素,推动模型迭代加速。
▸ 轻量级、高性价比模型(如o4-mini)的涌现,降低了先进AI能力的部署门槛,利好更广泛的应用场景。
“Gemini 2.5 Pro在lmarena.ai的评测中表现卓越,与OpenAI的新模型在多个类别中并列第一…期待展示更多成果。” - Demis Hassabis (Google DeepMind CEO)
📎 新模型的发布伴随着API文档细节遗漏问题,开发者需注意函数调用方式调整。
1.2 Meta确认Llama 4采用MoE架构,但细节保密
#模型架构 #Meta #Llama4 #MoE #大语言模型 | 影响指数:★★★★☆
📌 核心进展:Meta确认其下一代大模型Llama 4将从之前的Dense架构转向MoEs(Mixture of Experts)架构。虽然具体实现细节和性能提升数据尚未公开,但相关研究论文「OLMoE」已发布在arXiv上。
⚡ MoE架构理论上能更高效处理大规模数据和计算,但训练和推理复杂性也相应增加。
💡 行业影响:
▸ 标志着业界领先者对MoE架构潜力的认可,可能引领更多大型模型采用类似架构以平衡性能与效率。
▸ Meta的技术选型对开源社区具有重要示范效应,未来可能涌现更多基于MoE的开源模型和优化方案。
📎 此举是Meta在大型语言模型架构上的重要战略调整,具体效果有待Llama 4发布后验证。
1.3 清华大学研究揭示RL训练局限性,质疑LLM自我改进能力
#研究发现 #强化学习 #LLM #模型训练 #清华大学 | 影响指数:★★★☆☆
📌 核心进展:清华大学最新论文指出,当前基于强化学习(RL)的训练方法(如RLHF)更多是“压缩”模型已掌握知识的路径,而非“发现”新知识。尽管pass@1等指标提升,但模型的实际知识边界并未扩展,类似“教孩子背闪卡应试”。
⚡ 研究将RL训练比作优化已知证明路径的提取效率,而非探索未知领域。
💡 行业影响:
▸ 对当前主流LLM微调和对齐方法的有效性提出质疑,引发对过度依赖数据拟合而非真正智能涌现的担忧。
▸ 可能促使研究界探索新的训练范式,寻求能让模型真正学习和发现新知识的方法,推动AI向更深层次智能发展。
📎 该发现对LLM实现持续自我改进和通往AGI的路径提出了挑战。
1.4 Perplexity与摩托罗拉达成全球合作,AI助手预装新设备
#商业合作 #AI助手 #Perplexity #摩托罗拉 #移动AI | 影响指数:★★★☆☆
📌 核心进展:AI搜索与助手公司Perplexity宣布与摩托罗拉达成全球合作伙伴关系。Perplexity的Android应用将预装在所有新款摩托罗拉设备上。双方还优化了Perplexity Assistant,使其能在Moto Razr折叠屏关闭时被唤醒。新购机用户将获赠3个月Perplexity Pro服务。
⚡ 摩托罗拉新款Razr Ultra手机整合了Perplexity、Gemini和Copilot技术,定位为智能伴侣。
💡 行业影响:
▸ AI原生应用与硬件厂商深度绑定成为趋势,加速AI助手在移动端的普及和体验优化。
▸ 提升了Perplexity的市场覆盖和用户基数,也为摩托罗拉设备增加了差异化竞争优势。
📎 这是AI初创公司与大型硬件制造商合作,共同拓展AI应用生态的重要案例。
🛠️ 二、技术前沿 (Tech Radar)
2.1 Meta WebSSL DINO & ViT 模型
🏷️ 技术领域:计算机视觉 / 自监督学习(SSL) / 多模态
● 技术突破点:
▸ 超越CLIP:在视觉中心VQA任务上优于CLIP,并通过缩放缩小了OCR和图表任务差距。
▸ 扩展性更佳:CLIP在3B参数时饱和,而WebSSL在7B+参数时仍显示对数线性改进。
▸ 文本数据增强:在含文本图像上训练(占1.3%数据)显著提升OCR/图表性能(13.6%),无需语言监督。
▸ 高分辨率优势:使用518px分辨率进一步提升OCR/图表性能,缩小与SigLIP差距。
▸ 网络数据优越性:在网络规模数据(MC-2B)上训练的模型远优于ImageNet-1k训练的模型。
🔧 落地价值:提供了更强大、扩展性更好的开源视觉基础模型,有望提升下游视觉理解任务性能,特别是在文档理解、图表分析等领域。模型已集成至Transformers库。
2.2 Hogwild! Inference: 并行LLM生成新方法
🏷️ 技术领域:LLM推理优化 / 并行计算
● 核心创新点:
▸ 动态协作:多个LLM实例共享并同时更新KV缓存,能实时看到彼此进展并动态协作,而非固定角色。
▸ 高效共享:利用旋转位置嵌入(RoPE)特性高效共享注意力,避免昂贵的KV缓存重计算。
▸ 涌现式协作:协作从共享上下文和提示中动态产生,无需预定义任务。
📊 应用前景:在复杂推理任务上优于静态并行策略,有望提高LLM解决复杂问题的效率和能力,尤其适用于需要多角度思考或多路径探索的任务。
2.3 InternVL3: 原生多模态预训练范式
🏷️ 技术领域:多模态学习 / LLM预训练
● 技术突破点:
▸ 原生统一预训练:摒弃多阶段流程,在单一阶段联合学习语言和视觉,从文本和多模态数据中学习,改善整合度。
▸ 性能领先:InternVL3-78B在MMMU基准上达72.2%,超越已有开源模型。
▸ 深度融合:原生预训练将多模态理解嵌入基础,避免后期对齐的局限性。
▸ 协同优化:联合参数优化早期协同对齐视觉和语言,提升多模态任务性能。
▸ 保留语言能力:统一预训练中整合文本数据,保留强大语言技能。
🌐 行业影响:提出了一种更深层次、更有效的多模态大模型构建方法,可能推动开源多模态模型能力达到新高度,促进多模态应用的深入发展。
2.4 AllenAI DiscoveryBench: 自动化科学发现新基准
🏷️ 技术领域:AI for Science / 基准测试 / 数据驱动发现
● 核心创新点:
▸ 标准化评估框架:为评估AI系统在数据驱动的科学发现任务中的表现,提供标准化框架。
▸ 推动领域发展:旨在促进AI在科学发现交叉领域的研究和应用,衡量自动化发现能力。
▸ 开源共享:相关论文已发布于OpenReview,代码在GitHub开源,鼓励社区参与和使用。
🔧 落地价值:为AI驱动的科学研究提供了一个重要的评估工具,有助于量化进展、比较不同方法的优劣,加速AI在材料、生物、化学等科学领域的应用。
🌍 三、行业动态 (Sector Watch)
3.1 AI开发者工具与生态
🏭 领域概况:AI辅助编程日益普及,但开发者接纳度仍存分歧。IDE偏好、代码重构、安全检测成AI工具焦点。
◼ 核心动态:Andrew Ng指出AI降低了特定编程语言的学习门槛,开发者可跨语言编码。CodeRabbit等AI代理提供代码重构、调试、安全检测服务。Zencoder收购Machinet挑战GitHub Copilot。IDE偏好调查揭示真实使用情况。然而,部分开发者对AI工具采纳仍持保留态度。
📌 数据亮点:AI Math/Prog超越人类预测中位数年份为2029。
◼ 市场反应:一方面AI编程工具(如Copilot、CodeRabbit)受关注,融资并购活跃(Zencoder);另一方面,开发者社区存在对AI取代工作、改变工作习惯的担忧。
🔮 发展预测:AI将更深度融入开发流程,但开发者技能重点可能转向问题定义、系统设计和AI工具的有效利用。开发者社区的接受度和信任度建设是关键。
3.2 AI模型训练与部署
🚀 增长指数:★★★★☆
◼ 关键进展:业界观点转变,认为“训练未死”,LLM APIs并非万能。许多公司从API转向微调(Qwen, Llama, DeepSeek)、持续预训练及RLHF,利用自有数据迭代模型。Together AI与NVIDIA Blackwell合作将训练速度提升近2倍。Unsloth AI发布Dynamic v2.0 GGUFs优化量化LLM准确性。
🔍 深度解析:企业意识到私有数据的价值,定制化模型需求驱动训练回归。硬件进步(Blackwell)和优化技术(Together Training Stack, Unsloth量化)降低了训练门槛和成本。
◼ 产业链影响:带动GPU、AI训练平台、模型优化工具的需求。模型即服务(MaaS)与自建/微调模型形成互补生态。
📊 趋势图谱:混合策略(API+微调/自训练)将成主流。模型压缩、量化、高效推理技术(如HybriMoE, Hogwild!)持续受关注。数据隐私和合规性在训练中的重要性提升。
3.3 AI在特定行业的应用深化
🌐 全球视角:AI在内容、金融、工业、科学研究等领域应用加速,但也面临伦理、安全、实施挑战。
◼ 区域热点:Webtoon(韩国/全球)利用LangGraph大幅提升内容审核效率。Aleph Alpha(德国)收购Thingsthinking加速工业和金融AI解决方案。Jericho Security(北美)获融资对抗金融领域的深度伪造欺诈。
💼 商业模式:AI驱动的效率提升(Webtoon)、安全防护(Jericho)、特定领域解决方案(Aleph Alpha)成为主要价值点。AI技术与现有业务流程的整合是关键。
◼ 挑战与机遇:技术落地中的问题(如加州律考AI平台崩溃)、伦理担忧(如作弊技术销售)、研究方向争议(如美国教授项目被取消)并存。同时,AI在科学发现(DiscoveryBench, ZAPBench)、医疗(脑机接口)等领域展现巨大潜力。
🧩 生态构建:AI公司与传统行业巨头合作(Perplexity/摩托罗拉, NVIDIA/ServiceNow)、AI工具链完善(Hugging Face Data Studio, Gradio)、开源社区活跃(Nebius AI方案)共同推动生态发展。
📈 行业热力图(基于附件信息推断):
领域 | 融资热度 | 政策/伦理关注 | 技术突破 | 市场接受度/应用 |
---|---|---|---|---|
AI开发工具 | ▲▲▲▲ | ▲▲▲ | ▲▲▲▲ | ▲▲▲▲ |
AI基础模型 | ▲▲▲▲ | ▲▲▲▲ | ▲▲▲▲▲ | ▲▲▲▲▲ |
AI for Science | ▲▲▲ | ▲▲ | ▲▲▲▲ | ▲▲▲ |
AI安全/伦理 | ▲▲▲▲ | ▲▲▲▲▲ | ▲▲▲ | ▲▲▲ |
工业/金融 AI | ▲▲▲▲ | ▲▲▲ | ▲▲▲ | ▲▲▲ |
内容/媒体 AI | ▲▲▲ | ▲▲ | ▲▲▲▲ | ▲▲▲▲ |
💡 行业洞察:基础模型和开发者工具依然是投入和创新的核心。AI安全伦理问题日益突出。AI在科学、工业、金融等垂直领域的应用潜力巨大,商业化进程加速。
🎯 四、应用案例 (Case Study)
4.1 Webtoon利用LangGraph实现内容理解自动化
📍 应用场景:数字漫画平台Webtoon的内容库管理、营销、翻译和推荐。
● 实施效果:
关键指标 | 实施前 | 实施后 | 提升幅度 | 行业平均水平 |
---|---|---|---|---|
手动审核工作量 | 100% (估) | 减少70% | -70% | N/A |
团队创造力 | 依赖手动 | 提升 (定性描述) | 提升 | N/A |
洞察获取速度 | 较慢/手动 | 即时 (自然语言查询) | 大幅提升 | N/A |
● 核心功能 (WCAI):
▸ 角色与对话识别:通过视觉和文本分析检测角色并分配对话。
▸ 情节与基调提取:总结关键事件、情感弧线和叙事节奏。
▸ 自然语言洞察:允许团队用自然语言查询内容,获取即时答案。
💡 落地启示:利用图智能(LangGraph)构建多模态代理,能有效自动化复杂的内容理解任务,大幅提升内容密集型行业的运营效率和创造力。
🔍 技术亮点:智能多模态代理替代手动浏览,结合视觉与文本分析进行深度内容理解。
4.2 Copilot提前预测航班延误
📍 应用场景:个人出行场景中的实时信息获取与预测。
● 价值创造:
▸ 用户价值:在官方宣布前提供关键延误信息,帮助用户提前调整计划,减少不确定性和焦虑。
▸ 技术展示:体现了AI在整合、处理多源实时信息并进行有效预测方面的能力。
● 实施效果:
维度 | 量化结果/描述 | 行业对标 | 创新亮点 |
---|---|---|---|
预测准确性 | 准确预测延误 (个案) | 优于官方通知速度 | 实时信息整合与预测 |
用户体验 | 提前获知,“魔法时刻” (用户反馈) | 显著提升 | 主动推送关键信息 |
响应速度 | 快于官方和机场工作人员确认 (个案) | 领先 | 实时性 |
💡 落地启示:AI助手通过整合实时数据流,不仅能回答查询,更能主动提供预测性信息,显著提升用户在日常生活场景中的体验和决策效率。
🔮 未来展望:此类功能有望扩展到更多生活场景,如交通拥堵预测、活动变更通知等,成为AI助手的标配能力。
4.3 Perplexity iOS语音助手实现多场景任务
📍 应用场景:移动端个人助理,覆盖预订、导航、娱乐、出行等多种日常任务。
● 核心功能:
▸ 服务整合:能进行餐厅预订、使用Apple Maps导航、创建提醒。
▸ 内容消费:搜索并播放Apple Music或播客内容。
▸ 便捷出行:支持叫车服务。
▸ 硬件集成:可将功能映射到iPhone的Action Button,提升使用效率。
● 实施效果:
维度 | 描述 | 创新亮点 |
---|---|---|
功能覆盖度 | 广泛,覆盖生活服务多个方面 | 多任务整合 |
便捷性 | 语音交互,支持Action Button快速启动 | 易用性优化 |
生态整合 | 与Apple Maps, Music, Podcasts等系统应用集成 | 平台原生体验 |
💡 推广潜力:展示了语音助手从简单问答向复杂任务执行的演进方向,这种多功能整合能力有望成为未来移动AI助手的标准。
👥 五、AI人物 (Voices)
5.1 Andrew Ng (知名AI学者, Landing AI CEO)
👑 影响力指数:★★★★☆
“AI辅助编程…正在使特定的编程语言变得不那么重要…或许有一天,更多的开发者将不再被归类为「Python开发者」或「C++开发者」,而只是「开发者」…然而,理解不同语言背后的概念仍然重要。”
● 观点解析:
▸ 降低语言门槛:AI工具(如Copilot)让开发者能用不熟悉的语言编码,模糊了特定语言专长的界限。
▸ 概念理解仍关键:强调了理解编程基础概念(如数据结构、内存)的重要性,这有助于更有效地使用AI工具。
📌 背景补充:Andrew Ng以其在机器学习和在线教育领域的贡献而闻名,他的观点反映了AI对软件开发行业带来的深刻变革及对开发者技能要求的影响。
5.2 Richard Sutton (强化学习先驱)
👑 影响力指数:★★★★☆
(核心思想转述)与其探讨如何控制AI的目标,不如思考如何在不控制其目标的情况下与AI共创美好未来。
● 行业影响:
▸ 提供对齐新视角:提出了与主流AI安全“控制论”不同的“共存论”视角,引发对AI对齐问题本质的深入思考。
▸ 挑战现有范式:其观点可能对当前以目标对齐为核心的AI安全研究路径提出挑战。
📌 深度洞察:Sutton的观点根植于其对智能体自主学习和目标的深刻理解,强调适应和协作而非强制控制,对长期AGI发展具有哲学层面的指导意义。
5.3 Sundar Pichai (Google CEO)
👑 影响力指数:★★★★★
(Q1财报电话会议要点)“Gemini 2.5是目前最智能的模型…为未来创新提供了非凡基础…Gemini现已集成到所有15个拥有5亿以上用户的Google主要产品中…在Google Cloud Next上展示了AI领导力…”
● 市场反应:
▸ 展示AI战略决心:强调Gemini作为核心AI引擎在Google产品和服务中的全面渗透和领先地位。
▸ 提振市场信心:通过展示AI Studio用户增长、AI概览服务规模、硬件(TPU/Blackwell)实力及Waymo进展,向市场传递Google在AI竞赛中的强劲势头。
📌 前瞻视角:Pichai的讲话勾勒了Google以Gemini为核心,全面整合AI能力到其庞大生态系统(搜索、云、硬件、自动驾驶)的战略蓝图。
5.4 Mustafa Suleyman (Microsoft AI CEO)
👑 影响力指数:★★★★☆
(分享经历)Copilot 在洛杉矶国际机场(LAX)官方宣布之前就已准确预测了航班延误,甚至连登机口工作人员都确认了这一信息。
● 观点解析:
▸ 展示AI实用价值:通过个人经历生动展示了AI助手在处理实时信息、进行预测并提供超前洞察方面的“魔法时刻”。
▸ 预示AI助手未来:暗示AI技术将超越被动响应,成为主动、智能、能显著提升用户日常体验的伙伴。
📌 背景补充:作为微软AI负责人,Suleyman的分享不仅是个人趣闻,也反映了微软对其AI产品(Copilot)在现实世界中能力的信心和期望。
🧰 六、工具推荐 (Toolbox)
6.1 Nebius AI 数据迁移解决方案
🏷️ 适用场景:大规模对象存储桶之间的数据迁移,尤其是跨账户或跨云环境。
● 核心功能:
▸ 快速可靠:利用 @skypilot_org, s5cmd 和 Nebius AI Cloud 优化迁移过程,解决传统方法缓慢、不可靠的问题。
▸ 开源:解决方案完全开源,社区可自由访问、使用和贡献。
▸ 高性能:结合 skypilot 和 s5cmd 工具提供高性能数据传输能力。
● 使用体验:
▸ (易用性:可能需要一定技术背景进行配置 ★★★☆☆)
▸ (性价比:开源免费,但需考虑云资源成本 ★★★★☆)
🎯 用户画像:需要进行大规模云上数据迁移的架构师、运维工程师、数据工程师。
💡 专家点评:针对云数据迁移痛点提供了高效的开源解决方案,尤其适合需要高吞吐、跨云操作的场景。
6.2 Rime Arcana (AI语音合成)
🏷️ 适用场景:需要高度逼真、富有情感和细节的人声合成,如商业语音代理、沉浸式聊天机器人、创意故事讲述、多语言对话。
● 核心功能:
▸ 超高保真度:声称拥有最真实的TTS技术,能捕捉口音、笑声、叹息等细微差别。
▸ 无限声音生成:允许开发者通过描述或虚构名称生成无限声音。
▸ 即时可用:通过API和仪表板提供,无需等待列表。
● 使用体验:
▸ (易用性:API和仪表板接入,相对便捷 ★★★★☆)
▸ (效果:宣称“最真实”,需用户自行评判 ★★★★★ 潜力)
🎯 用户画像:游戏开发者、虚拟助手开发者、内容创作者、需要多语言本地化语音的企业。
💡 专家点评:在TTS的自然度和表现力上设定了新标杆,特别适合对语音情感和真实感要求高的应用。
6.3 CodeRabbit AI (代码辅助代理)
🏷️ 适用场景:代码重构、代码调试、安全漏洞检测。
● 核心功能:
▸ 智能重构:协助开发者重构混乱的代码,提升代码质量。
▸ 问题规划与修复:通过 @coderabbitai plan
指令启动详细规划,最终生成可直接合并的PR。
▸ 安全检测:辅助发现代码中的安全漏洞。
▸ 集成:可与Cursor或Windsurf等编码工具配合,通过GitHub授权启用。
● 使用体验:
▸ (易用性:指令式交互,集成GitHub,相对方便 ★★★★☆)
▸ (效率提升:有望显著减少重构和调试时间 ★★★★☆)
🎯 用户画像:软件开发者、希望提高代码质量和开发效率的团队。
💡 专家点评:将AI能力应用于代码生命周期的关键环节(重构、调试、安全),是AI辅助编程领域的重要实践。
6.4 Surya OCR (光学字符识别)
🏷️ 适用场景:从PDF等文档中提取文字和结构信息,支持多种语言和复杂格式。
● 核心功能:
▸ 多语言支持:支持90+语言,重点覆盖英、中、日、韩、阿拉伯语及罗曼语族。
▸ 格式保留:支持LaTeX和格式化文本的识别。
▸ 结构化输出:提供字符/单词/行边界框信息。
▸ 高性能:处理速度可达10-20页/秒 (H100测试)。
▸ 集成Marker:可与Marker工具配合使用,提升PDF处理能力。
● 使用体验:
▸ (易用性:通过pip安装,命令行或API调用 ★★★☆☆)
▸ (准确性:Alpha版本,持续优化中 ★★★★☆ 潜力)
🎯 用户画像:需要从文档中提取大量文本信息的开发者、数据科学家、档案数字化工作者。
💡 专家点评:一款功能强大、支持语言众多且性能优异的开源OCR工具,特别是在处理格式化文本和多语言文档方面具有优势。
🎩 七、AI趣闻 (Fun Corner)
7.1 2028/2029年:AI超越人类数学/编程的最佳年份?
🤖 背景简介:一项针对AI何时能在需要顶尖人类专家一周努力的数学和编程任务上超越人类的调查结果公布。
● 有趣之处:
▸ 众数预测:最多人预测的年份是2028年。
▸ 中位数预测:预测年份的中位数是2029年。
● 延伸思考:
▸ 这类预测反映了社区对AI能力发展速度的预期,虽然具体年份有待商榷,但普遍认为AI在这两大认知要求极高的领域取得突破性进展已为时不远。
📊 社区反响:引发关于AGI时间线、AI能力边界以及对人类专家未来角色的讨论。
7.2 AI代理“幻觉”出新功能,开发者竟意外喜欢
🤖 背景简介:开发者Dan Shipper分享,在使用AI代理编码时,AI不仅完成了要求,还“幻觉”出了一个他没想到的新功能。
● 有趣之处:
▸ 意外惊喜:AI的“错误”或“创造性发挥”有时能带来意想不到的正面效果。
▸ 超越指令:展示了AI在特定任务中可能展现出的、超出明确指令的“创造力”火花。
● 延伸思考:
▸ 这提示我们,与AI协作可能不仅仅是执行指令,也可能包含接受和利用AI的“意外发现”。如何引导和利用这种“创造性幻觉”可能成为新的研究方向。
📊 社区反响:引发关于AI创造力、人机协作模式以及如何评估AI“幻觉”价值的讨论。
7.3 寻找消失的GPU深度学习先驱
🤖 背景简介:深度学习的兴起离不开GPU加速,但编写了首个在游戏GPU上训练神经网络CUDA代码的先驱人物,如今却神秘消失,社区正在寻找其下落。
● 有趣之处:
▸ 历史谜团:AI发展史上的关键人物竟然“查无此人”,增添了一丝神秘色彩。
▸ 社区寻人:展现了技术社区对历史贡献者的尊重和好奇心。
● 延伸思考:
▸ 提醒我们关注那些在重大技术突破背后默默无闻的贡献者,以及技术发展历程中的偶然与必然。
📊 社区反响:引发了对早期深度学习历史的回忆和讨论,以及对这位匿名先驱身份的猜测。
📌 每日金句
💭 今日思考:生成式AI正在使语法变得不那么重要,因此开发者可以同时成为Python、JS、TS、C++、Java甚至Cobol的开发者...然而,理解不同语言背后的概念仍然重要。
👤 出自:Andrew Ng (知名AI学者, Landing AI CEO)
🔍 延伸:AI工具降低了技术实现的门槛,但深刻理解底层原理和抽象概念,依然是优秀开发者的核心竞争力,也是有效利用AI工具的基础。
相关文章:
AI日报 - 2025年04月26日
🌟 今日概览(60秒速览) ▎🤖 模型竞赛 | OpenAI与Google新模型在Arena榜单激烈角逐,性能指标各有千秋。 OpenAI发布o3/o4-mini等新模型,Gemini 2.5 Pro紧随其后,数学、编程能力成焦点。 ▎💼 商业动向 | 并…...
ES6 Map/WeakMap/Set/WeakSet 全解指南
一、设计思想与核心概念 1. 解决传统结构的痛点 Object:键只能是字符串/Symbol、无序、无size属性Array:查找效率低(O(n))、无自动去重机制核心突破:// 传统方式 vs ES6方式 const obj { [{}]: value }; // 键会被转为"[object Obje…...
【Python】使用uv管理python虚拟环境
本文介绍了python虚拟环境管理工具uv,包括uv的作用、uv的常用命令等等。 参考:UV - 管理Python 版本、环境、第三方包 1. 介绍uv 官网:https://docs.astral.sh/uv/ uv是一个python虚拟环境管理工具,可以用来替代pip、pyenv、vir…...
求解,如何控制三相无刷电机?欢迎到访评论
问题:通过一个集成的TF2104芯片控制H桥上桥臂和下桥臂,如何控制?还是说得需要PWM_UH和PWM_UL分开控制?...
002 六自由度舵机机械臂——姿态解算理论
00 DH模型的核心概念 【全程干货【六轴机械臂正逆解计算及仿真示例】】 如何实现机械臂的逆解计算-机器谱-robotway DH模型是机器人运动学建模的基础方法,通过四个参数描述相邻关节坐标系之间的变换关系。其核心思想是将复杂的空间位姿转换分解为绕轴旋转…...
部署大模型需要多少GPU显存?以DeepSeek R1部署为例
引言 部署大型语言模型(LLM)时究竟需要多少GPU显存?本文将进行一次简单测算。 如何计算 算法1 可以用一个简单的公式来计算显存占用(单位GB): 参数说明如下: 符号 含义 M 所需的 GPU 显存…...
C++?类和对象(下)!!!
一、前言 在之前我们已经讨论过了有关类和对象的前置知识以及类中的六大默认成员函数,在本期我们继续再讨论类和对象中剩余的友元、初始化列表等相关知识,如果需要再了解之前的知识的话,链接奉上:C?类和对象࿰…...
function,bind,lambda的用法
C中的std::function、std::bind与Lambda表达式详解 一、std::function std::function是C11标准引入的类模板,用于封装任意类型的可调用对象,例如函数指针、Lambda表达式、函数对象等。通过std::function可以实现不同形式可调用对象的统一存储与调用…...
Maven的聚合工程与继承
目录 一、为什么需要使用Maven工程 二、聚合工程的结构 三、聚合工程实现步骤 四、父工程统一管理版本 五、编译打包 大家好,我是jstart千语。想着平时开发项目似乎都是用maven来管理的,并且大多都是聚合工程。而且在maven的聚合工程中,…...
C/C++对时间的处理
1. 两种数据结构 time_t 是一个在C和C++编程语言中用于表示时间的类型。time_t类型通常是一个长整型(long int)或整数类型,用于表示从特定参考点(通常是1970年1月1日00:00:00 UTC)经过的秒数。 time_t定义在<ctime>头文件中,通常用于记录时间戳,比如获取当前时间…...
Spring Boot 支持政策
🧑💻 Spring Boot 支持政策 ✒️ Andy Wilkinson 于2023年12月7日编辑本页 32次修订 📌 核心政策 🛡️ VMware Tanzu 开源支持政策 Spring Boot 针对关键错误和安全问题提供支持 📆 版本支持周期 1️⃣ 主要版本&a…...
实验四 进程调度实验
一、实验目的 1、了解操作系统CPU管理的主要内容。 2、加深理解操作系统管理控制进程的数据结构--PCB。 3、掌握几种常见的CPU调度算法(FCFS、SJF、HRRF、RR)的基本思想和实现过程。 4、用C语言模拟实现CPU调度算法。 5、掌握CPU调度算法性能评价指…...
静态多态和动态多态的区别
C多态机制深度解析 多态是面向对象编程的核心特性,允许通过统一接口执行不同实现。在C中,多态表现为基类指针或引用调用虚函数时,根据实际对象类型执行对应派生类的函数逻辑。 基础实现示例 定义基类与派生类,演示动态绑定…...
现代化Android开发:Compose提示信息的最佳封装方案
在 Android 开发中,良好的用户反馈机制至关重要。Jetpack Compose 提供了现代化的 UI 构建方式,但提示信息(Toast/Snackbar)的管理往往显得分散。本文将介绍如何优雅地封装提示信息,提升代码可维护性。 一、基础封装方案 1. 简单 Snackbar …...
Android学习总结之Retrofit篇
1. 注解原理概述 在 Java 里,注解是一种元数据,它为代码提供额外信息但不影响程序的实际逻辑。注解可以在类、方法、字段等元素上使用,并且能在编译时、运行时通过反射机制被读取。Retrofit 充分利用了 Java 注解机制,通过自定义…...
Python 第 12、13 节课 - 元组和列表
- 第 94 篇 - Date: 2025 - 04 - 26 Author: 郑龙浩/仟墨 【Python 在校课堂笔记】 Python 第 12、13 节课 - 元组和列表 上课时间: 2025-04-21(12) 2025-04-24(13) 文章目录 Python 第 12、13 节课 - 元组和列表一 元组1 元组的…...
新特性版本升级指引
✨ 升级到新特性版本时的配置迁移 1️⃣ 🔧 配置迁移工具说明 当您将应用升级到新特性版本时,可能需要处理部分配置属性的重命名或移除问题。 2️⃣ 🚀 启用方法 Spring Boot 提供了环境分析工具: 应用启动时打印诊断信息运行时…...
6.1 客户服务:智能客服与自动化支持系统的构建
随着企业数字化转型的加速,客户服务作为企业与用户交互的核心环节,正经历从传统人工服务向智能化、自动化服务的深刻变革。基于大语言模型(LLM)和智能代理(Agent)的技术为构建智能客服与自动化支持系统提供…...
从新手到高手:小程序开发进阶技巧分享
小程序开发从入门到精通需要经历技术积累、架构优化和工程化实践等多个阶段。以下是结合真实项目经验的进阶路线与核心技术要点,涵盖性能优化、架构设计、跨平台开发等关键领域: 一、性能调优实战技巧 1. 首屏渲染加速方案 // 预请求关键数据ÿ…...
S参数的含义
S参数的含义: 在低速设计时代,工程界普遍使用等效集总电路模型来描述互连通道的过孔、连接器等各部分。对于上升时间达到几个ns的低速数字信号,甚至可以使用一个0Ω电阻代替连接器,分析的结果也不会和实际情况有太大的差别。但是当…...
职场十二法则-马方
马方老师的《职场十二法则》,献给初入职场工作中迷茫的自己。 1.挣钱是能力的副产品,能力比挣钱重要,让自己值钱比有钱更重要。成长比赚钱重要,年轻时把成长放第一位,挣钱放第二位,通过提升能力实现长期收益。 2.成长…...
安装docker,在docker上安装mysql,docker上安装nginx
目录 一.安装docker 1.1查看Linux版本的命令这里推荐两种: 1.2查看内核版本有三种方式: 2.安装 2.1 如果之前安装了docker,先删除旧版本的doker 2.2 安装需要的软件包,yum-util提供yum-config-manager功能,另外两…...
Java基础第五章、面向对象程序设计
1.package包 如果引入的不同包里面有相同的类名时,需要对要使用的类进行完整的限定名指定。 2.访问修饰符 子类对父类的方法重写也遵循上面的原则 一个java文件中最多只能有一个public(和文件同名)的类。 3.初始化块 //Driver.java public class Driver {private lo…...
RD电子实验记录本选用贴士A-B-C
传统的实验记录本,令人又爱又恨本 如何挑选电子实验室记录本(ELN)的品牌/服务商/供应商? 电子实验记录本,又名为ELN,Electronic lab notebook,enotebook,研发电子管理系统…...
Python 第 11 节课 - string 与 random 的方法
- 第 93 篇 - Date: 2025 - 04 - 26 Author: 郑龙浩/仟墨 【Python 在校课堂笔记】 Python 第 11 节课 - string 与 random 的方法 上课时间: 2025-04-14 文章目录 Python 第 11 节课 - string 与 random 的方法一 string 的方法1 s.split()2 s.find()3 s.replace()4 s.strip…...
proxychains4系统代理for linux(加速国内github下载速度,pip安装)
1.proxychains4代理安装: sudo apt-get install proxychains42.找到配置文件/etc/proxychains4.conf在[ProxyList]后面添加以下内容: socks5 127.0.0.1 10808 配置如下: 3.使用proxychains4(git clone): proxychains4 git c…...
LLM基础之源码一
transformers 核心源码梳理 Trainer部分: __init__() 初始化函数: def __init__(xxx):if args is None:output_dir "tmp_trainer"args TrainingArguments(output_diroutput_dir) self.args argsself.compute_loss_func compute_loss_fun…...
蛮荒tv桌面永不升级版app下载-蛮荒桌面安卓电视版下载
蛮荒桌面是一款具有丰富桌面内容的生活应用软件,可以连接电视上使用,用户将需要的软件添加到桌面上,系统就会自动分类管理软件,小编今天为大家推荐一款功能更大强大的电视桌面应用——乐看家桌面。 乐看家桌面功能亮点: 1.官网下载刷入机顶盒…...
2025蓝桥省赛c++B组第二场题解
前言 这场的题目非常的简单啊,至于为什么有第二场,因为当时河北正在刮大风被迫停止了QwQ,个人感觉是历年来最简单的一场,如果有什么不足之处,还望补充。 试题 A: 密密摆放 【问题描述】 小蓝有一个大箱子࿰…...
c#简易超市充值卡程序充值消费查余额
开发背景 本软件是给克什克腾旗某公司开发的一个简易的超市充值卡程序 # 功能 1、充值卡的充值、消费、查询余额 github下载:https://github.com/oyangxizhe/cash.git...
使用FME生成Delaunay三角形
目录 背景与应用场景 前置条件与数据准备 操作流程详解 3.1 点要素矢量化3.2 设置坐标系3.3 生成Delaunay三角形...
三款实用工具推荐:图片无损放大+音乐格式转换+音视频格式转换!
在这个数字化时代,总有些工具能让人眼前一亮。今天李师傅大家精选三款实用工具,从图片优化到格式转换,解决日常创作中的痛点,让数字生活更得心应手。 在这个数字化时代,总有些工具能让人眼前一亮。今天为大家精选三款…...
文本预处理(NLTK)
1. 自然语言处理基础概念 1.1 什么是自然语言处理 自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于…...
泰迪杯实战案例学习资料:生产线的故障自动识别和人员配置优化
(西南石油大学,第十二届泰迪杯特等奖案例) (深度扩展版) 一、案例背景与目标 1.1 问题背景 在制造业中,生产线设备故障可能导致以下问题: 停机损失:每小时停机成本可达数万元(视行业而定)。 资源浪费:人工排班不合理导致高技能员工闲置或低效分配。 安全隐患:未及…...
dijkstra
open_set是当前正在计算的节点; 每次从当前open_set集合中找出cost最小的节点进行计算更新:从open_set中去除该节点,保存到close_set中; 运动更新可以根据运动模型选择合适的节点运动方式; 【代价的计算方式是&…...
【SSH 端口转发】通过SSH端口转发实现访问远程服务器的 tensorboard
SSH 连接远程服务器时的命令: ssh -L 8001:localhost:8001 usrnameserverip-L: 这是指定进行本地端口转发的选项。也就是说,要将本地机器的一个端口通过 SSH 隧道转发到远程服务器上的某个服务。 8001:localhost:8001: 第一个 80…...
w308汽车销售系统的设计与实现
🙊作者简介:多年一线开发工作经验,原创团队,分享技术代码帮助学生学习,独立完成自己的网站项目。 代码可以查看文章末尾⬇️联系方式获取,记得注明来意哦~🌹赠送计算机毕业设计600个选题excel文…...
Spring 学习笔记之 @Transactional 异常不回滚汇总
使用springboot时,只要引入spring-jdbc/jpa相关的依赖后,在想要启用事务的方法上加上Transactional注解就能开启事务,碰到异常就能自动回滚。大大的提高了编码的便捷性性,同时也不侵入代码,保持了代码的简洁性。 默认情…...
Java 自定义TCP协议:【特点编码字符串<=>字节<=>特点编码16进制】16进制字符串和编码的转换 (各种编码通过字节向16进制的互转)| XOR计算
文章目录 引言I 各种编码通过字节向16进制的互转。字符串<=>字节<=>16进制 | Java验证微信小程序 JavaScript字符串转gb2312 字符编码,以16进制字符串传输。(接收蓝牙设备的信息,发送北斗终端消息)II xor校验码Java实现验证C# 实现引言 为了避免中文在传输过程…...
大模型的使用
以下是不同类型大模型及其适用场景: 对话模型 - 代表模型:GPT-3.5/4、Claude、LaMDA、ChatGLM等。 - 适用场景:客服机器人为用户解答常见问题,提供实时支持;个人助理帮助用户完成各种任务,如查询信息、设置…...
OSPF的不规则区域和特殊区域
目录 一、OSPF不规则区域类型 1、非骨干区域无法和骨干区域保持连通 2、骨干区域被分割 解决方案 1、使用虚连接 2、使用多进程双向重发布(路由引入) 二、特殊区域 1、STUB区域(末梢区域) 2、totally stub区域(…...
C++学习:六个月从基础到就业——STL:分配器与设计原理
C学习:六个月从基础到就业——STL:分配器与设计原理 本文是我C学习之旅系列的第三十篇技术文章,也是第二阶段"C进阶特性"的第九篇,主要介绍C STL中的分配器设计原理与实现。查看完整系列目录了解更多内容。 引言 在之前…...
QQMusic项目功能总结
QQMusic项目功能总结 一、核心功能分类 (一)界面交互功能 功能模块实现方式使用类(自定义/Qt库)核心类说明窗口布局Head区(图标、搜索框、控制按钮) Body区(左侧功能栏右侧页面区)…...
人形机器人:MCP与人形机器人的联系
MCP(Model Context Protocol)与人形机器人的结合,正在重构智能体与物理世界的交互范式。这种联系不仅体现在技术架构的深度融合,更体现在对机器人认知能力、协作模式和应用场景的全方位赋能。以下从技术整合、场景落地和未来趋势三…...
matplotlib画图工具使用(1) 画折线统计图python代码
Python 画折线统计图(line chart)最常用的是 matplotlib。 最基本的折线图代码如下: import matplotlib.pyplot as plt# 假设这是你的数据 x [1, 2, 3, 4, 5] y [2, 3, 5, 7, 11]# 创建折线图 plt.plot(x, y, markero) # markero 是在点…...
神经网络与深度学习第四章-前馈神经网络
前馈神经网络 在本章中,我们主要关注采用误差反向传播来进行学习的神经网络。 4.1 神经元 神经元是构成神经网络的基本单元。主要是模拟生物神经元的结构和特性,接收一组输入信号并产生输出。 现代神经元中的激活函数通常要求是连续可导的函数。 净输…...
TC3xx学习笔记-UCB BMHD使用详解(一)
文章目录 前言UCB BMHDPINDISHWCFGLSENA0-3LBISTENACHSWENABMHDIDSTADCRCBMHDCRCBMHD_NPW0-7 总结 前言 AURIX Tc系列Mcu启动过程,必须要了解BMHD,本文详细介绍BMHD的定义及使用过程 UCB BMHD UCB表示User Configuration Block,UCB是Dflash,存储的地址…...
C语言 函数递归
目录 1.什么是递归 2.递归的限制条件 3.递归的举例 1.递归与迭代 1.递归是什么 递归是学习C语言函数绕不开的一个话题,那什么是递归呢? 递归其实是一种解决问题的方法,在C语言中,递归就是函数自己调用自己。 写一个史上最简单的C语言…...
4月25日日记(补)
最近实在是忙的不行了,做不到一天一更,但是实际上只需要每天拿出十分钟就可以写一篇不错的随笔或者说日记,我还是有点倦怠了。 昨天是4月25,我的生日,但是依旧是很忙碌的一天。零点准时拆了朋友们送的礼物,…...
【股票系统】使用docker本地构建ai-hedge-fund项目,模拟大师炒股进行分析。人工智能的对冲基金的开源项目
股票系统: https://github.com/virattt/ai-hedge-fund 镜像地址: https://gitcode.com/gh_mirrors/ai/ai-hedge-fund 项目地址: https://gitee.com/pythonstock/docker-run-ai-hedge-fund 这是一个基于人工智能的对冲基金的原理验证项目。本项目旨在探讨利用人工智能进行…...