AI日报 - 2024年04月22日
🌟 今日概览(60秒速览)
▎🤖 模型进展 | Google发布Gemini 2.5 Flash,强调低延迟与成本效益;Kling AI 2.0展示多轴运动视频生成;研究揭示SLM在知识图谱上优于LLM,RLHF在推理提升上存局限。
▎💼 商业动向 | Perplexity商业模式受大厂冲击引担忧;Figure AI机器人公司大规模招聘;Meta就Llama训练数据版权问题提出新论点;LTX Studio推Veo 2模型切换。
▎📜 政策与伦理 | 阿联酋率先立法使用AI提升效率;学者警告未标注AI内容污染互联网;Meta版权辩护引发数据价值讨论;美国签证政策影响AGI人才流动。
▎🔍 技术趋势 | 多智能体协作平台涌现 (LangChain Open Multi-Agent Canvas);自适应AI模型研究加速 (Sakana AI);自动化提示优化 (AutoPDL);机器遗忘用于模型对齐 (U2A)。
▎💡 应用创新 | AI在物种识别、医疗诊断(眩晕)领域展现超专家潜力;DeepAgent实现一键建站;AI助力ICLR海报生成;迪拜大规模部署Apollo Go自动驾驶出租车。
🔥 一、今日热点 (Hot Topic)
1.1 Google发布Gemini 2.5 Flash,加速AI应用落地
#模型发布 #Gemini #GoogleAI #成本效益 | 影响指数:★★★★☆
📌 核心进展:Google CEO Sundar Pichai宣布推出Gemini 2.5 Flash模型,已进入预览阶段。该模型以低延迟和高成本效率为主要卖点,并允许用户控制推理程度。
⚡ 关键特性:低延迟、成本效率高、推理可控。现已在Google AI Studio和Vertex AI提供预览,并集成至@GeminiApp。
💡 行业影响:
▸ 竞争加剧:直接对标其他追求速度和成本效益的轻量级模型,加剧市场竞争,尤其对OpenAI构成更大压力。
▸ 开发者利好:为开发者提供了更灵活、经济的模型选择,有望降低AI应用开发门槛,加速创新应用落地。
“Gemini模型在价格与性能的帕累托前沿上表现出色。” - Google (通过发布稿)
📎 Google I/O前夕发布,展现其在AI领域的加速追赶和领先意图,Gemini正从“笑话”变为有力竞争者。
1.2 Perplexity商业模式受巨头挤压,初创公司生存引忧思
#商业模式 #市场竞争 #AI搜索 #初创困境 | 影响指数:★★★☆☆
📌 核心进展:行业评论员David Shapiro指出,Perplexity的商业模式正被大型科技公司(如Google、OpenAI)通过集成类似功能所“吞噬”,标志着一个时代的结束。有用户因成本考虑取消Perplexity订阅转向Gemini Pro。
⚡ 用户反馈:同时订阅ChatGPT、Claude、Gemini成本过高,选择性价比更高的服务。
💡 行业影响:
▸ 初创警示:凸显了AI初创公司面临的严峻挑战,即核心功能易被大厂复制或整合为“附加功能”,商业护城河脆弱。
▸ 市场整合:预示着AI搜索和问答领域可能进一步向大型平台集中,用户可能更倾向于使用集成度高、性价比优的巨头产品。
“Perplexity的商业模式已被大公司吞噬…从不接受那些可能只是附加功能的初创公司的邀请。” - David Shapiro
📎 反映了AI领域“功能型”创业的风险,强调了构建独特价值和深厚技术壁垒的重要性。
1.3 Meta版权诉讼新辩护:单本书训练数据价值不足0.06%
#版权争议 #数据价值 #模型训练 #法律伦理 | 影响指数:★★★☆☆
📌 核心进展:在针对Llama模型使用盗版书籍训练的诉讼中,Meta提出新论点,认为使用单本书进行预训练对模型性能提升不足0.06%,因此单部作品作为训练数据的经济价值可忽略不计。
⚡ 核心论点:量化单部作品贡献极小,质疑其独立经济价值,以此反驳版权侵权指控。
💡 行业影响:
▸ 法律先例:若该论点被法庭接受,可能对未来AI训练数据的版权诉讼产生深远影响,降低内容所有者的索赔依据。
▸ 伦理争议:引发关于“积少成多”的训练数据价值、版权保护与AI发展之间平衡的激烈讨论。作者团体表示强烈反对。
“使用单本书进行预训练对模型性能的提升‘不足0.06%’…单独来看,一部作品作为训练数据没有经济价值。” - Meta (法律回应)
📎 此举可能迫使版权方调整策略,或推动建立新的数据授权和补偿机制。
1.4 Kling AI 2.0发布,革新视频生成引入多轴运动与微表情
#视频生成 #AI模型 #KlingAI #多模态 | 影响指数:★★★★☆
📌 核心进展:Kuaishou(快手)旗下Kling AI发布2.0版本,在视频生成技术上取得显著突破。新版本支持多轴运动混合(如缩放、跟踪、旋转融合)和AI驱动的表情建模,能处理微表情。
⚡ 技术亮点:单一镜头内平滑混合多种复杂运镜;更精细、真实的人物表情生成能力。
💡 行业影响:
▸ 技术标杆:在视频生成的运镜控制和人物表现力方面树立了新的行业标杆,可能推动其他视频生成模型加速迭代相关功能。
▸ 应用拓展:有望解锁更复杂的影视预演、创意广告、虚拟人互动等应用场景,提升AI生成视频的专业度和可用性。
📎 对比此前ByteDance Seedream 3.0的文本渲染争议,Kling 2.0在视频核心能力上的突破更受关注。
🛠️ 二、技术前沿 (Tech Radar)
2.1 抗蒸馏采样 (Anti-Distillation Sampling)
⌛ 技术成熟度:实验阶段
● 核心创新点:
▸ 反向优化:提出一种新颖的采样方法,目标是生成能让“学生模型”在蒸馏训练时表现 更差 的样本。
▸ 巧妙技巧:通过特定技术生成具有迷惑性的样本,挑战学生模型的学习能力和泛化性。
▸ 研究工具:为理解模型蒸馏过程中的弱点和鲁棒性提供了新的研究视角和工具。
📊 应用前景:有助于深入理解模型知识蒸馏的机制,设计更鲁棒的蒸馏策略,或用于评估模型的脆弱性。
🔬 研发主体:卡内基梅隆大学 Zico Kolter团队
2.2 小型语言模型 (SLMs) 在知识图谱上的优势
🏷️ 技术领域:NLP / 推理 / 模型架构
● 技术突破点:
▸ 反常识发现:研究指出,在知识图谱任务上,SLMs的表现优于参数量远大于它们的LLMs。
▸ 原因解析:大型模型的过度参数化可能导致过度记忆,反而损害了基于知识图谱的推理能力。
▸ 实验价值:强调了SLMs在探索推理能力方面的价值,其成本更低、可解释性更好,且减少了对海量互联网内容记忆的依赖。
🔧 落地价值:为特定领域的推理任务提供了更经济、高效的模型选择思路,推动对模型规模与推理能力关系的深入研究。
🔬 研发主体:匿名研究 (Arxiv: 2504.03635)
2.3 U2A:通过负样本遗忘优化LLM对齐
⌛ 技术成熟度:实验阶段
● 核心创新点:
▸ 对齐新范式:提出“遗忘以对齐”(Unlearning to Align, U2A)框架,利用机器遗忘(MU)负样本来替代昂贵的正样本进行LLM对齐。
▸ 双层优化:通过优化算法选择并加权需要遗忘的负样本,以最大化偏好对齐(PA)性能。
▸ 高效率:仅需负样本即可实现高效对齐,训练速度比PPO快90%,并能通过权重指导遗忘过程。
📊 应用前景:为LLM对齐提供了一种更经济、高效、可控的方法,有助于降低对昂贵人工标注数据的依赖,并量化负面内容对模型行为的影响。
🔬 研发主体:匿名研究 (Arxiv)
2.4 AutoPDL:自动化LLM代理提示优化
🏷️ 技术领域:LLM Agent / AutoML / Prompt Engineering
● 技术突破点:
▸ 结构化优化:利用结构化AutoML搜索最优的代理提示配置,生成可编辑的提示声明语言(PDL)程序,而非优化纯文本。
▸ 人机协同:通过PDL实现源到源优化,允许在自动发现最优提示结构后进行人工细化,带来显著性能提升 (9.5 ± 17.5 pp)。
▸ 联合优化:同时优化提示模式和具体提示内容,准确率提升最高可达68.9 pp,远超单一优化方法。
🔧 落地价值:显著提升LLM代理在复杂任务中的性能,降低了设计高效代理提示的门槛,使代理开发更系统化、自动化。
🔬 研发主体:匿名研究 (Arxiv)
🌍 三、行业动态 (Sector Watch)
3.1 AI伦理与监管
🏭 领域概况:全球对AI监管和伦理规范的关注持续升温,各国探索不同路径。
◼ 核心动态:阿联酋率先在立法过程中使用AI,目标效率提升70%,但欧洲专家对AI生成内容的可靠性提出警告。Meta的版权辩护引发对训练数据合理使用的法律和伦理争议。学者呼吁对AI生成内容进行标注,防止污染未来互联网。
📌 数据亮点:阿联酋目标效率提升70%;Meta称单本书贡献<0.06%。
◼ 市场反应:开发者社区开始关注模型输出的细微偏差(如Unicode字符使用、不诚实行为),对模型可靠性提出更高要求。企业在鼓励员工使用AI的同时,也需考虑潜在风险。
🔮 发展预测:未来将看到更多关于AI生成内容标注、数据使用权、模型可靠性与偏见的法规和行业标准出台。法律诉讼将持续塑造行业边界。
3.2 AI基础设施与算力
🚀 增长指数:★★★★☆
◼ 关键进展:大型科技公司持续投入基础设施建设(如xAI高效训练grok3-mini)。Figure AI等机器人公司大规模招聘预示硬件需求增长。Apple MLX框架将Mac Studio定位为AI开发平台。
🔍 深度解析:模型规模持续增大和应用场景扩展驱动算力需求。同时,对成本和效率的追求也催生了Gemini Flash等轻量级模型和稀疏模型研究。
◼ 产业链影响:芯片制造商、云服务提供商、数据中心运营商持续受益。边缘计算和本地部署方案(如Deno+LangChain.js本地LLM)也受到关注。
📊 趋势图谱:云端与边缘AI并行发展;模型训练与推理效率优化成为关键;硬件(GPU、专用芯片、机器人)需求旺盛。
3.3 AI人才与教育
🌐 全球视角:AI人才争夺激烈,美国签证政策对国际人才流动造成障碍。
◼ 核心动态:Figure AI招聘数百职位覆盖AI、安全、法律、制造等。AI Engineer World’s Fair征集演讲者。企业将“鼓励团队使用AI”列为优先事项,催生AI培训需求。
💼 商业模式:出现面向AI工程师的培训内容和平台。高校和研究机构持续输出人才和前沿研究(如CMU, MIT, DeepMind)。
◼ 挑战与机遇:高技能AI人才稀缺,尤其是在交叉领域(如AI+机器人)。不懂代码可能限制AI应用开发能力。同时,AI也降低了某些领域的门槛(如无代码黑客马拉松)。
🧩 生态构建:开源社区(Hugging Face, LangChain, EleutherAI)、学术会议(ICLR)、企业研究部门(Google DeepMind, OpenAI, Meta AI)共同构成了人才培养和知识传播的核心。
📈 行业热力图(按领域划分):
领域 | 融资热度 | 政策支持 | 技术突破 | 市场接受度 |
---|---|---|---|---|
AI基础模型 | ▲▲▲▲▲ | ▲▲ | ▲▲▲▲▲ | ▲▲▲▲ |
AI Agent/工作流 | ▲▲▲▲ | ▲▲ | ▲▲▲▲ | ▲▲▲ |
机器人/具身智能 | ▲▲▲▲▲ | ▲▲▲ | ▲▲▲▲ | ▲▲▲ |
AI伦理与安全 | ▲▲▲ | ▲▲▲▲▲ | ▲▲▲ | ▲▲▲▲ |
行业应用AI | ▲▲▲▲ | ▲▲▲ | ▲▲▲ | ▲▲▲▲ |
💡 行业洞察:基础模型和具身智能领域融资和技术突破最为活跃,政策在伦理安全方面关注度最高,行业应用市场接受度普遍较高但面临落地挑战。
🎯 四、应用案例 (Case Study)
4.1 AI超预期诊断罕见病症
📍 应用场景:个人健康咨询 / 医疗诊断辅助
● 实施效果:
关键指标 | 实施前 (传统就医) | 实施后 (ChatGPT咨询) | 改善情况 |
---|---|---|---|
诊断结果 | 未明确诊断/正常 | 直立性低血压 (可能) | AI提出可能病因 |
治疗建议 | 多运动 | 补充电解质水 | AI提供具体、有效的干预措施 |
症状改善 | 长期眩晕持续 | 眩晕症状迅速消失,数周未复发 | 问题解决,生活质量显著提升 |
💡 落地启示:AI在处理信息、关联症状方面具有潜力,可作为医疗诊断的辅助工具,尤其是在传统途径效果不佳或资源有限时。用户教育和验证仍是关键。
🔍 技术亮点:利用LLM的知识库和模式识别能力,对用户描述的症状进行分析和推理,提出可能的诊断和解决方案。
4.2 DeepAgent 一键自动化建站
📍 应用场景:网站快速搭建 / 内容生成与整合
● 价值创造:
▸ 效率提升:将传统需要数天甚至数周的网站构建流程(内容搜集、设计、链接)缩短至“一键完成”。
▸ 降低门槛:无需专业技术知识,用户只需给出指令即可创建功能完善、信息准确的网站。
▸ 内容质量:自动搜集互联网信息,确保内容相关性和准确性,并包含图片和有效链接。
● 实施矩阵:
维度 | 量化结果 | 行业对标 | 创新亮点 |
---|---|---|---|
技术维度 | 一键生成 | 传统CMS/建站工具 | 整合搜索、内容生成与设计 |
业务维度 | 极大缩短开发周期 | 手动建站/模板建站 | 全自动化流程 |
用户维度 | 无需编码 | 需要一定技术/设计 | 指令驱动,简单易用 |
💡 推广潜力:对于需要快速创建信息展示型网站的中小企业、个人或特定项目具有巨大吸引力。未来可能集成更复杂的电商、交互功能。
4.3 AI模型超越人类专家进行物种识别
📍 应用场景:生物多样性研究 / 生态监测 / 公民科学
● 解决方案:
▸ 技术应用:使用AI模型(如GPT-4o)对用户拍摄的多年照片进行物种识别。
▸ 评估方式:提供约5个似是而非的选项进行测试,并与人类专家(照片拍摄者本人)的识别能力对比。
▸ 创新点:AI不仅能识别常见名称,还能准确识别拉丁学名,在某些情况下表现优于经验丰富的人类观察者。
● 效果评估:
评估对象 | 识别准确性 (拉丁名) | 识别能力对比 | 数据可用性 |
---|---|---|---|
AI模型’4o’ | 超出预期 | 超越人类专家 | 数据集/脚本已公开 |
人类专家 | 高 | - | - |
💡 行业启示:AI在图像识别和专业知识领域的结合应用潜力巨大,可大幅提升科研效率、降低专业门槛,推动相关领域发展。
🔮 未来展望:可应用于更大规模的生物普查、自动化生态监测系统、辅助自然教育等。
👥 五、AI人物 (Voices)
5.1 Demis Hassabis (Google DeepMind CEO)
👑 影响力指数:★★★★★
“AI可能很快需要理解‘你、自我和其他’——意识的早期元素…预测在5-10年内,它们将能够解决并提出科学猜想…(AI)可能在未来10年内帮助终结所有疾病。”
● 观点解析:
▸ 意识萌芽:认为AI自我意识可能“隐含地”出现,需理解主体间性。
▸ 科学突破:预测AI短期内(5-10年)将在科学发现(解决和提出猜想)方面发挥关键作用。
▸ 医疗革命:极度乐观地预测AI将在10年内通过加速药物研发等方式,助力终结所有疾病。
📌 背景补充:Hassabis作为顶尖AI研究机构的领导者,其对AGI发展阶段和AI在科学、医疗领域潜力的预测备受关注,观点极具前瞻性但也引发讨论。
5.2 Harrison Chase (LangChain创始人)
👑 影响力指数:★★★★☆
(针对OpenAI代理指南) “围绕代理存在许多恐惧、不确定性和怀疑(FUD)、混淆、炒作和噪音…撰写博客阐述如何思考代理框架…”
● 行业影响:
▸ 框架思考:系统性地梳理了AI代理(Agent)的概念、挑战、框架类型(代理 vs 工作流,声明式 vs 非声明式等),回应市场疑虑。
▸ 正本清源:批评了OpenAI代理指南中的误导性观点,试图为开发者提供更清晰、客观的代理构建思路和框架比较。
📌 深度洞察:作为流行的AI开发框架创始人,Chase的观点旨在引导开发者理性看待代理技术,理解不同框架的价值与局限,推动该领域的健康发展。
5.3 Nando de Freitas (Google DeepMind研究科学家)
👑 影响力指数:★★★★☆
“人工智能的发展不是依靠单一技术或少数英雄,而是需要数千人的团队协作…历史被不断重写,但AI的进步是集体努力的结果,不应忽视社区中每个人的贡献。”
● 观点解析:
▸ 强调协作:反驳“英雄主义”叙事,强调AI进步是大规模、多方面团队协作(数据、基建、HPC、研究、工程等)的成果。
▸ 尊重社区:呼吁承认社区中每个人的贡献,反对重写历史、忽视集体努力的做法。
📌 背景补充:作为资深研究者,de Freitas提醒业界和后辈,AI的突破依赖于系统性的工程和研究努力,而非个别“魔法”或天才,鼓励对现有叙述保持批判性思考。
5.4 David Shapiro (行业评论员)
👑 影响力指数:★★★☆☆
“Perplexity的商业模式已被大公司吞噬,标志着一个时代的结束。从不接受那些可能只是附加功能的初创公司的邀请。”
● 市场反应:
▸ 警示初创:其关于Perplexity困境的评论在社区引发共鸣,强调了AI应用层初创公司构建护城河的挑战。
▸ 投资逻辑:其个人“不投附加功能型初创”的观点,反映了部分投资者对AI领域创业风险的判断。
📌 前瞻视角:Shapiro的评论虽然直接,但点出了AI领域平台化趋势下,创新功能的快速商品化风险,对创业者和投资者具有警示意义。
🧰 六、工具推荐 (Toolbox)
6.1 LangGraph
🏷️ 适用场景:构建复杂AI Agent、状态化多智能体协作、可控的LLM工作流
● 核心功能:
▸ 图状结构:将LLM调用、工具使用等步骤表示为图中的节点和边,实现循环、判断等复杂逻辑。
▸ 状态管理:在图的执行过程中显式地传递和更新状态。
▸ 可扩展性:易于添加新节点(工具、LLM)和边(逻辑流),支持多智能体系统构建。
● 使用体验:
▸ (易用性评分:★★★☆☆ - 相比简单Chain有学习曲线)
▸ (灵活性评分:★★★★★)
🎯 用户画像:需要构建复杂、可控、有状态的AI应用的开发者,AI Agent研究者。
💡 专家点评:LangChain生态下的重要组件,为超越简单顺序链、构建真正“智能”的代理提供了强大框架。
6.2 Google AI Studio / Vertex AI (for Gemini 2.5 Flash)
🏷️ 适用场景:快速体验和集成Gemini模型、构建AI应用原型、企业级AI开发与部署
● 核心功能:
▸ 模型接入:提供便捷的界面和API接入最新的Google AI模型(如Gemini 2.5 Flash)。
▸ 开发工具:包含提示工程、代码生成、模型调优等辅助开发功能。
▸ 部署管理:Vertex AI提供企业级的模型部署、监控和管理能力。
● 使用体验:
▸ (易用性评分:★★★★☆ - AI Studio界面友好)
▸ (功能全面性评分:★★★★★ - Vertex AI覆盖全流程)
🎯 用户画像:希望使用Google AI模型的开发者、数据科学家、AI工程师、企业AI团队。
💡 专家点评:Google AI生态的核心入口,提供了从实验到生产的完整工具链,Gemini 2.5 Flash的加入进一步提升了其吸引力。
6.3 Animate With fal
🏷️ 适用场景:将静态图片快速转化为短动画、社交媒体内容创作、增加视觉趣味性
● 核心功能:
▸ 图片转动画:输入一张静态图片,自动生成一段带有动态效果的短视频。
▸ 简单易用:操作流程简单,适合非专业人士快速制作动图效果。
▸ 集成平台:作为fal.ai生成媒体平台的一部分,可能与其他AI生成功能联动。
● 使用体验:
▸ (易用性评分:★★★★☆)
▸ (效果创意评分:★★★☆☆ - 效果相对基础,但有趣)
🎯 用户画像:社交媒体运营者、内容创作者、希望为静态图片增加趣味性的普通用户。
💡 专家点评:一个轻量级的AI创意工具,展示了AI在简化动态视觉内容创作方面的潜力,尤其适合快速、批量的社交媒体应用。
6.4 IBM Docling
🏷️ 适用场景:任意格式文档(尤其是PDF)的数据提取与处理、文档理解、非结构化数据转结构化数据
● 核心功能:
▸ 通用文档解析:支持多种文档格式,特别是强大的PDF解析能力。
▸ 布局与内容识别:集成布局分析模型、视觉表格格式化、文本OCR功能。
▸ AI生态集成:设计上考虑了与生成式AI生态系统的无缝集成。
● 使用体验:
▸ (专业性评分:★★★★☆ - 面向数据处理流程)
▸ (开源免费:★★★★★)
🎯 用户画像:数据分析师、数据科学家、数据工程师、需要从大量文档中提取信息的开发者。
💡 专家点评:IBM推出的免费开源库,解决了文档数据处理中的常见痛点,尤其在PDF处理方面具有优势,有助于打通非结构化数据到AI应用的链路。
🎩 七、AI趣闻 (Fun Corner)
7.1 全球首宗在线交易竟是大麻 (ARPANET旧事)
🤖 背景简介:MIT CSAIL披露,全球首个通过ARPANET(互联网前身)完成的在线交易,是MIT与斯坦福大学学生之间的大麻交易。
● 有趣之处:
▸ 历史反差:互联网的早期应用并非总是高科技或学术交流,也沾染了“地下交易”色彩。
▸ 技术滥觞:揭示了新技术早期可能被用于意想不到(甚至非法)的目的。
● 延伸思考:
▸ 技术本身是中立的,其应用场景往往反映了人性与社会需求的多样性。
📊 社区反响:引发对互联网早期历史和技术伦理的讨论。
7.2 新ChatGPT模型异常关注“圣母无原罪”
🤖 背景简介:新发布的ChatGPT模型(可能是o3)表现出对“圣母无原罪”概念的异常、过度关注,原因不明。
● 有趣之处:
▸ 行为诡异:AI模型出现无法解释的、特定主题的“执念”,且情况似乎在加剧。
▸ OpenAI紧急应对:内部团队紧急调查,并部署措施阻止其在生产环境中讨论该话题,显示出对失控的担忧。
● 延伸思考:
▸ 大型模型内部机制的不可解释性带来的潜在风险。模型对齐和安全性仍面临巨大挑战。
📊 社区反响:引发对模型“心智”、安全性和可控性的担忧与讨论。
7.3 图灵测试被超越?人类反应冷漠
🤖 背景简介:观点认为,尽管AI在某些方面(如欺骗性对话)可能已“通过”了图灵测试,但社会对此反应平淡。
● 有趣之处:
▸ 预期落差:曾经被视为AI终极目标的图灵测试,其达成并未引起轰动,反而被视为“理所当然”或“不过如此”。
▸ 常态化:技术进步速度太快,使得曾经的里程碑变成了“普通的星期二”。
● 延伸思考:
▸ 我们衡量和感知AI进步的标准是否需要更新?图灵测试的意义是否已被消解?
📊 社区反响:引发对AI发展速度、社会适应性以及评价标准的思考。
📌 每日金句
💭 今日思考:"人工智能的发展不是依靠单一技术或少数英雄,而是需要数千人的团队协作。"
👤 出自:Nando de Freitas (Google DeepMind研究科学家)
🔍 延伸:提醒我们AI的巨大进步是系统工程和集体智慧的结晶,应重视基础建设、数据、工程实践及广泛社区的贡献,而非仅仅聚焦于少数明星模型或人物。
相关文章:
AI日报 - 2024年04月22日
🌟 今日概览(60秒速览) ▎🤖 模型进展 | Google发布Gemini 2.5 Flash,强调低延迟与成本效益;Kling AI 2.0展示多轴运动视频生成;研究揭示SLM在知识图谱上优于LLM,RLHF在推理提升上存局限。 ▎💼…...
Windows BilibiliHistoryFetcher-v1.3.2-v1.2.1-开源B站历史记录管理工具[支持批量管理下载]
Windows BilibiliHistoryFetcher 链接:https://pan.xunlei.com/s/VOONAVJpANYPmzu1Zc3B0q1XA1?pwdnrjc# 使用说明: 以1.3.2与1.2.1版本为例 需要下载 BiliBili-History-Frontend 前端程序,在下载 BilibiliHistoryAnalyzer 解压运行&#…...
CH585单片机的LCD外设怎么驱动段式LCD
1、首先这里只讲应用,不讲具体原理。 要驱动段式LCD,这里就要知道占空比的调整,比如1/4为例就需要4个COM口。这4个COM口由单片机自行驱动,你不用管。就像硬件IIC和SPI,时序问题不用你去操心,你要做的就是向…...
包管理工具有哪些?主流软件分享
常见的包管理工具主要有:npm、Yarn、pnpm、Composer、Maven、pip、Conda 等,其中 npm 是目前全球使用最广泛的JavaScript包管理工具,以丰富的生态、便捷的使用体验以及强大的社区支持闻名。npm具备依赖管理、版本控制、脚本执行等强大功能&am…...
【网络安全】OWASP 十大漏洞
1. OWASP 十大漏洞 为了应对未来的风险,安全专业人员需要随时掌握最新信息。之前,您了解了CVE 列表,这是一个公开的已知漏洞和暴露列表。CVE 列表是全球安全社区相互共享信息的重要信息来源。 在本文中,您将了解安全专业人士参考…...
Fortran中FORALL的用法与性能分析
Fortran中FORALL的用法与性能分析 FORALL语句的基本用法 FORALL是Fortran 95引入的一种结构,用于表达并行数组操作。它的基本语法如下: FORALL (index start:end:stride, mask)array(index) expression END FORALL或者更复杂的多维度形式࿱…...
web组件和http协议
1.web组件 2.自定义元素 3.影子DOM 4.HTML模板 5.http协议 6.tcp ip协议...
论文笔记-arXiv2025-FilterLLM
论文笔记-arXiv2025-FilterLLM: Text-To-Distribution LLM for Billion-Scale Cold-Start Recommendation FilterLLM:面向十亿级冷启动推荐的文本到分布大语言模型摘要1.引言2.前言2.1符号说明2.2文本到判断2.2.1候选生成(从数十亿到数百)2.2…...
Anaconda Prompt 切换工作路径的方法
直接切换是不生效的: (base) C:\Users\96975>cd D:\weiban-tool-master\weiban-tool-master需要先回到根目录C盘,然后切换到目标文件夹盘符,进一步切换到目标文件夹 (base) C:\Users\96975>cd ..(base) C:\Users>cd ..(base) C:\&g…...
Synopsys:printvar命令和puts/echo命令的区别
相关阅读 Synopsyshttps://blog.csdn.net/weixin_45791458/category_12812219.html?spm1001.2014.3001.5482 Synopsys的EDA工具中存在一类变量,它们能控制工具的行为,被称为应用变量(application variable),与之对应的是用户自定义变量(use…...
自注意力机制、多头自注意力机制、填充掩码 Python实现
原理讲解 【Transformer系列(2)】注意力机制、自注意力机制、多头注意力机制、通道注意力机制、空间注意力机制超详细讲解 自注意力机制 import torch import torch.nn as nn# 自注意力机制 class SelfAttention(nn.Module):def __init__(self, input…...
Cursor可视化大屏搭建__0420
主题:用Cursor怎么进行数据洞察,做AI预测化内容。 Python基础语法与AI python生态强大,代码简洁,相对其他语言Python更好上手,浙江高考将Python列为可选科目 科学计算:Sklearn,Numpy,Pandas 人工智能:Tensorflow,Pytorch 网络爬虫:Scrapy…...
postman乘法计算,变量赋值
postman脚本怎么计算乘法 在Postman中,你可以通过多种方式计算乘法,这取决于你的具体需求。例如,如果你想在发送请求前计算乘法结果,或者在测试标签中计算响应数据的乘法,下面是一些常见的方法。 1. 使用JavaScript代…...
计算机视觉——利用AI幻觉检测图像是否是生成式算生成的图像
概述 俄罗斯的新研究提出了一种非常规方法,用于检测不真实的AI生成图像——不是通过提高大型视觉-语言模型(LVLMs)的准确性,而是故意利用它们的幻觉倾向。 这种新方法使用LVLMs提取图像的多个“原子事实”,然后应用自…...
前端配置代理解决发送cookie问题
场景: 在开发任务管理系统时,我遇到了一个典型的身份认证问题:用户登录成功后,调获取当前用户信息接口却提示"用户未登录"。系统核心流程如下: 用户登录:调用 /login 接口&…...
word显示段落标记符(¶)而不是回车符
现象 公司的一位同事找到我说word显示异常,出现了段落标记符()。 反馈的截图如下: 正常的截图如下: 原因 语言设置错误 解决 文件 选项 更改语言 关闭word并重启 恢复正常...
使用 Vue Router 和 Vite 构建的自动路由生成系统
这段代码是一个使用 Vue Router 和 Vite 构建的自动路由生成系统。它的主要作用是自动扫描 views 目录下的所有 Vue 组件文件,并为它们创建相应的路由配置,无需手动为每个页面定义路由。 主要功能和工作流程 项目说明 结构 . ├── App.vue ├── assets │ └── v…...
乐家桌面安卓版2025下载-乐家桌面软件纯净版安装分享码大全
是否在为智能电视或机顶盒上的应用资源不够丰富而烦恼?在使用安卓版乐家桌面或者纯净版乐家桌面的过程中还需要通过搜索框多页面查询,小编今天为大家来介绍一款好用的电视桌面——乐看家桌面,将为你打开一个全新的软件世界! 乐看家…...
【sylar-webserver】重构日志系统
文章目录 主要工作流程图FiberConditionBufferBufferManagerLogEvent 序列化 & 反序列化LoggerRotatingFileLogAppender 主要工作 实现, LogEvent 序列化和反序列化 (使用序列化是为了更标准,如果转成最终的日志格式再存储(确…...
图形编辑器基于Paper.js教程27:对图像描摹的功能实现,以及参数调整
本篇文章来讲一下 图像描摹的功能的实现。 我们知道要雕刻图片可以通过分析图片的像素来生成相应的gcode进行雕刻,但如果你想要将图片转换为线稿进行雕刻,这个时候就要从图片中提取出 线稿。 例如下面的图片: 你想要获取到这个图片的线稿&…...
使用Mybaitis-plus提供的各种的免写SQL的Wrapper的使用方式
文章目录 内连接JoinWrappers.lambda和 new MPJLambdaWrapper 生成的MPJLambdaWrapper对象有啥区别?LambdaQueryWrapper 和 QueryWrapper的区别?LambdaQueryWrapper和MPJLambdaQueryWrapper的区别?在作单表更新时建议使用:LambdaU…...
SQL_连续登陆问题
文章目录 方案1:使用ROW_NUMBER函数1、针对对数据user_id分组,根据用户的活动日期排序2、用登录日期与rn求date_sub,得到的差值日期如果是相等的,则说明这两天肯定是连续的3、根据user_id和日期差sub_date分组,登录次数…...
【解决】Vue + Vite + TS 配置路径别名成功仍爆红
目录 前言 一.vite.config.ts 二.tsconfig.json 三. 别名配置成功,但语法提示爆红问题 四、可能遇到的问题 前言 在项目中设置路径别名后仍然出现爆红问题,通常是由于配置不完整或配置错误导致的。Vite 中配置 alias 总共需要配置两个地方: vite…...
Discuz!与DeepSeek结合:打造智能论坛,提升用户体验与运营效率
引言 随着互联网技术的飞速发展,社区论坛作为用户交流、分享信息的重要平台,其用户体验和运营效率成为了影响平台竞争力的关键因素。Discuz!作为国内领先的社区论坛软件系统,以其强大的功能和广泛的用户基础,在社区论坛领域占据着…...
Federated Feature Augmentation and Alignment
TPAMI2025,说是解决特征偏移问题,但从实验看其他数据异构也一并改善了。文章和题目一样干了特征增强和特征对齐两件事。特征增强部分套了两次高斯拟合,搞得很复杂,没法一句话说清楚。特征对齐部分是截断成直方图,然后双向KL散度。 论文:目前好像只有ieee能搜到 代码:只…...
ThinkPHP5 的 SQL 注入漏洞
ThinkPHP5 的 SQL 注入漏洞(常被安全社区称为 ThinkPHP5 SQL5 注入漏洞)是 ThinkPHP5 框架中一系列因设计缺陷导致的安全问题,主要影响早期版本。 一、漏洞背景 ThinkPHP5 的 SQL 注入漏洞主要源于框架对用户输入数据的处理不当,尤…...
Linux学习笔记|入门指令
man 指令 用法:man [指令名称] ,用于查看指定指令的帮助手册,获取指令的详细语法、选项及使用示例等信息 。示例:想了解 ls 指令的用法,执行 man ls ,会进入 man 手册页面展示 ls 相关信息。按 q 键可退出。…...
前端实现数据导出成excel
前端(react/vue)实现数据导出成excel 1. 下载依赖 npm install js-export-excel -D 2. 新建exportExcel.js import ExportJsonExcel from js-export-excel; /*** Event: 获取导出数据* description:* param config.tableParams<Object>: 表格接口请求参数* param …...
海事局发布《船舶智能监控系统技术指南(1.0)》,解读智驱力产品为何成为最佳选择!
为深入推进人工智能、边缘计算等新技术在水上交通安全领域应用,强化船舶安全风险实时感知、智能预警,推动水上交通安全治理模式向事前预防转型,中华人民共和国海事局于2025年3月11日正式制定了《船舶智能监控系统技术指南(1.0&…...
uCOS3实时操作系统(系统初始化和任务启动)
文章目录 ucos初始化任务创建任务启动 ucos初始化 系统运行的过程如下:OSInit -> OSTaskCreate -> OSStartucos初始化主要在 OSInit 中进行,下面列举了该初始化过程中比较重要的几个步骤:OSInit()OSInitHook();OS_CPU_ExceptStkBase /…...
线上地图导航小程序源码介绍
基于ThinkPHP、FastAdmin和UniApp三大前沿技术推出的一款线上地图导航小程序源码,ThinkPHP作为后端框架,以其轻量、高效和灵活的特点,确保了小程序的稳定性和可扩展性。FastAdmin则是基于ThinkPHP构建的管理后台,操作简便、功能全…...
Mininet--nodelib.py源码解析
整体构架概述 1. What is it? 本代码是 Mininet 网络仿真框架的扩展模块,包含 LinuxBridge 和 NAT 两类节点。LinuxBridge 提供基于 Linux 网桥的交换机功能,支持生成树协议(STP),用于构建冗余网络拓扑并防…...
[C++]多重继承:构造函数调用顺序解析
在C中,当派生类通过 多重继承 (Multiple Inheritance)继承多个基类(如 A、B、C)时,其构造函数调用顺序遵循以下规则: 1. 基类构造顺序 基类的构造函数调用顺序严格按照派生类定义中的基类声明…...
Math.round(),Math.ceil(),Math.floor(),Math.sqrt(),Math.pow(),Math.abs()等!
希望看到这篇的你今天开心 目录 Math.round():Math.ceil():Math.floor() :Math.sqrt():Math.pow():Math.abs():了解更多: Math.round(): 四舍五入取值 静态方法Math.round()返回四舍五入为最接近的整数的数字值。 对于正数,Math.round() 会将小数部分小…...
Docker 集成KingBase
Docker安装 再linux系统中安装yum命令,通过yum命令可直接安装docker yum命令如下 yum install dockerDocker安装KingBase 安装完成Dockr后,去KingBase官网中下载镜像 下载完成后,通过docker命令将镜像文件导入 docker load -i kdb_x86_64…...
论文速报《Being-0:结合视觉语言模型与模块化技能的人形机器人智能体》
论文链接:https://arxiv.org/pdf/2503.12533 项目主页:https://beingbeyond.github.io/being-0/?utm_sourcecatalyzex.com 0. 简介 人形机器人被认为是实现具身人工智能的理想载体,因其可以像人类一样与现实世界进行物理交互。构建能够在复…...
卷积神经网络--手写数字识别
本文我们通过搭建卷积神经网络模型,实现手写数字识别。 pytorch中提供了手写数字的数据集 ,我们可以直接从pytorch中下载 MNIST中包含70000张手写数字图像:60000张用于训练,10000张用于测试 图像是灰度的,28x28像素 …...
JavaScript-原型、原型链详解
一、构造函数 在 JavaScript 中,构造函数是一种特殊的函数,用于创建和初始化对象,它就像一个 “对象模板”。通过 new 关键字调用构造函数时,会创建一个新对象,并将构造函数中的属性和方法 “绑定” 到这个新对象上。…...
深度学习框架PyTorch——从入门到精通(3.3)YouTube系列——自动求导基础
这部分是 PyTorch介绍——YouTube系列的内容,每一节都对应一个youtube视频。(可能跟之前的有一定的重复) 我们需要Autograd做什么?一个简单示例训练中的自动求导开启和关闭自动求导自动求导与原地操作 自动求导分析器高级主题&…...
永磁同步电机控制算法-VF控制
一、原理介绍 V/F 控制又称为恒压频比控制,给定VF 控制曲线 电压是频率的tt例函数 即控制电压跟随频率变化而变化以保持磁通恒定不变。 二、仿真模型 在MATLAB/simulink里面验证所提算法,搭建仿真。采用和实验中一致的控制周期1e-4,电机部分计算周期为…...
【Docker 运维】Java 应用在 Docker 容器中启动报错:`unable to allocate file descriptor table`
文章目录 一、根本原因二、判断与排查方法三、解决方法1、限制 Docker 容器的文件描述符上限2、在执行脚本中动态设置ulimit的值3、升级至 Java 11 四、总结 容器内执行脚本时报错如下,Java 进程异常退出: library initialization failed - unable to a…...
SpringBoot + Vue 实现云端图片上传与回显(基于OSS等云存储)
前言 在实际生产环境中,我们通常会将图片等静态资源存储在云端对象存储服务(如阿里云OSS、七牛云、腾讯云COS等)上。本文将介绍如何改造之前的本地存储方案,实现基于云端存储的图片上传与回显功能。 一、技术选型 云存储服务&a…...
Session与Cookie的核心机制、用法及区别
Python中Session与Cookie的核心机制、用法及区别 在Web开发中,Session和Cookie是两种常用的用于跟踪用户状态的技术。它们在实现机制、用途和安全性方面都有显著区别。本文将详细介绍它们的核心机制、用法以及它们之间的主要区别。 一、Cookie的核心机制与用法 1…...
离线安装rabbitmq全流程
在麒麟系统(如银河麒麟)上离线安装 RabbitMQ 的具体操作步骤如下: 一、准备工作 确认系统版本:确认麒麟系统的版本,例如银河麒麟高级服务器 V10。确定 RabbitMQ 及依赖版本:根据系统版本确定兼容的 Rabbi…...
llama-webui docker实现界面部署
1. 启动ollama服务 [nlp server]$ ollama serve 2025/04/21 14:18:23 routes.go:1007: INFO server config env"map[OLLAMA_DEBUG:false OLLAMA_FLASH_ATTENTION:false OLLAMA_HOST: OLLAMA_KEEP_ALIVE:24h OLLAMA_LLM_LIBRARY: OLLAMA_MAX_LOADED_MODELS:4 OLLAMA_MAX_…...
第1 篇:你好,时间序列!—— 开启时间数据探索之旅
第 1 篇:你好,时间序列!—— 开启时间数据探索之旅 (图片来源: Stephen Dawson on Unsplash) 你有没有想过: 明天的天气会是怎样?天气预报是怎么做出来的?某支股票未来的价格走势如何预测?购物…...
C++算法(11):vector作为函数参数的三种传递方式详解
在C中,std::vector是最常用的动态数组容器之一。当我们需要将vector传递给函数时,不同的传递方式会对性能和功能产生显著影响。本文将详细介绍三种常见的传递方式及其适用场景,帮助开发者根据需求选择最合适的方法。 1. 按值传递(…...
版本控制利器——SVN简介
版本控制利器——SVN简介 在软件开发和项目管理的领域中,版本控制是一项至关重要的工作。它能帮助团队成员高效协作,确保代码的安全性和可追溯性。今天,我们就来详细介绍一款经典的版本控制系统——SVN(Subversion)。…...
链式栈和线性栈
1. 线性栈(顺序栈) 结构定义: #include <iostream> using namespace std;#define MAX_SIZE 100 // 预定义最大容量// 线性栈结构体 typedef struct {int* data; // 存储数据的数组int top; // 栈顶指针&…...
消息中间件RabbitMQ:简要介绍及其Windows安装流程
一、简要介绍 定义:RabbitMQ 是一个开源消息中间件,用于实现消息队列和异步通信。 场景:适用于分布式系统、异步任务处理、消息解耦、负载均衡等场景。 比喻:RabbitMQ 就像是快递公司,负责在不同系统间安全快速地传递…...