从零到顶会:一位 NLP 研究者的实战经验与资源指南
“如何从本科阶段起步,一步步发表顶会论文?”
“大模型时代,科研新手还有机会吗?”
“顶会论文,是运气,还是可以复制的路径?”
如果你也曾在深夜对着空白的论文文档发呆,或在 arXiv 上刷到一篇惊艳的论文时心生羡慕,那么这篇文章,或许能为你点亮一盏灯。
本文将架构梳理一位在 NLP 领域连续发表 ACL、EMNLP、AAAI 等 CCF-A/B 类顶会研究者的实战经验,涵盖:
- 如何寻找研究方向与创新点
- 如何高效写作与可视化
- 如何做好论文宣传与展示
- 以及——最全的科研资源清单
无论你是本科生、硕士生,还是刚入门的博士生,这篇指南都值得收藏。
一、科研起点:从“不知道做什么”到“找到方向”
很多人的科研第一步,是迷茫的。
但真正的起点,不是“灵光一现”,而是扎实的积累与系统的输入。
1. 打好基础:深度学习与 NLP 入门
在动手做研究之前,先确保你掌握了以下核心知识:
- 深度学习基础(CNN、RNN、Transformer)
- 自然语言处理基本任务(分类、生成、解析)
- PyTorch/TensorFlow 编程能力
推荐学习资源:
CS224N(斯坦福大学 NLP 课程)
https://web.stanford.edu/class/cs224n/
全球最权威的 NLP 入门课,配套作业极佳。MIT 6.5940(机器学习环境)
关注模型部署与工程实践,适合想做系统型研究的同学。B站系列课程
如“跟李沐学 AI”等中文优质视频,适合快速上手。
二、科研信息获取:紧跟前沿,不被时代抛弃
大模型时代,科研进展日新月异。
否“过时”就是信息获取能力,决定了你的研究。
1. 必刷平台清单
平台 | 用途 | 链接 |
---|---|---|
arXiv | 获取最新预印本 | https://arxiv.org/list/cs.CL/recent |
Papers with Code | arXiv 论文 + 代码 + 评测 | https://papers.cool/arxiv/cs.CL |
HuggingFace Daily Papers | 每日精选 NLP 论文 | https://huggingface.co/papers/ |
GitHub | 关注领域内活跃作者的开源项目 | https://github.com |
✅ 建议:每天花 30 分钟刷 arXiv 和 Twitter(X),培养“学术嗅觉”。
2. 如何高效追踪热点?
- 关注学术大 V:从你领域内的知名研究者出发,顺着他们的关注列表和评论区“挖矿”。
- 订阅 Newsletter:如 The Batch、Import AI 等。
- 刷学术社区:知乎、小红书、公众号也有高质量解读(但需甄别)。
- 公众号:机器之心,量子位,新智元。
三、研究方向选择:热点 vs 冷门,如何权衡?
选方向,是科研的第一道分水岭。
类型 | 优点 | 缺点 |
---|---|---|
热点方向(如 Agent、LLM) | 影响力大,易发顶会 | 竞争激烈,资源消耗大 |
冷门方向(如结构化生成) | 竞争小,易出创新 | 影响力有限,求职时优势弱 |
建议策略:
- 初期可选择“热点 + 经典任务”的结合,如“用 LLM 做情感分析”。
- 中后期逐步深入,形成自己的研究主线。
四、Idea 从哪里来?创新点的生成方法论
“没有 idea”是常态。
但创新并非凭空而来,而是对现有工作的深刻洞察。
几种经典的 idea 构造方式:
老挑战,新手段
例如:用 Prompt Tuning 解决传统分类任务。新问题,老方法
例如:将 LoRA 应用于高效微调。方法 A + B
例如:将缓存压缩与动态激活结合。看 Survey 的“未来展望”
很多综述论文的结尾会指出“未解决的困难”,这是绝佳的切入点。读论文的“Limitation”部分
作者自己指出的不足,往往是下一个工作的起点。读博士论文
刚毕业博士的论文通常系统性强,且包含大量未结束的尝试。
✍️ 五、论文写作:讲好一个“动听的故事”
顶会论文的本质,是讲一个完整、可信、有启发性的故事。
1. 论文结构 = 故事框架
- 背景:领域现状,大家在做什么?
- 动机:现有方法有什么问题?为什么要紧?
- 方法:你是怎么解决的?创新点在哪?
- 实验:你的办法真的有用吗?
- 展望:未来还能怎么改进?
✅ 写作口诀:动机要强,方法要新,实验要 solid。
2. 写作资源推荐
《如何写一篇合格的 NLP 论文》
一篇被广泛引用的写作指南,教你如何组织段落与逻辑。
https://zhuanlan.zhihu.com/p/58752815《机器翻译学术论文写作方法和技巧》
清华大学出品,细节拉满,适合精读。
https://nlp.csai.tsinghua.edu.cn/~ly/talks/cwmt14_tut.pdf
3. 图表设计:决定论文的“第一印象”
在 *ACL 等顶会,图表质量可能决定审稿人是否愿意读下去。
设计建议:
- 配色:使用科研风配色或糖果色,避免刺眼。
推荐工具:https://colorhunt.co/ - 图标:使用矢量图标提升专业感。
推荐网站:https://www.iconfont.cn/(阿里矢量库) - 绘图工具:PPT、draw.io、Figma 都是不错选择。
4. Rebuttal:如何回应审稿人?
- 不涨分是常态,降低预期,保持礼貌。
- 对质疑要逐条回应,有理有据。
- 可参考知乎文章《顶会 rebuttal 技术浅谈》。
六、论文宣传:让工作被看见
“酒香也怕巷子深”。
一篇好论文,需要主动宣传,才能扩大影响力。
1. 宣传渠道
GitHub ReadMe / GitHub Page
用美观的页面展示项目,附上 demo 和链接。
示例:https://alibaba-nlp.github.io/WebAgent/HuggingFace / ModelScope
上传模型和 demo,加入每日论文推荐。Gradio / Streamlit Demo
对于 Agent 类项目,一个可交互的 demo 比千言万语更有说服力。公众号 / 学术群 / Twitter
写一段简洁有力的宣传文案,配上图表,引发讨论。
2. 宣传文案模板
我们提出了 [方法名],首次将 [手艺 A] 与 [技术 B] 结合,解决了 [难题]。在 [任务] 上达到 SOTA,代码已开源!
七、会议展示:从 Poster 到 Oral
中稿只是开始,开会才是扩大学术圈影响力的契机。
1. 展示建议
- Poster 设计:信息分层,图文并茂,重点突出。
- Oral 演讲:控制节奏,留出问答时间。
- 主动交流:多参加 workshop、social event,结识同行。
2. 心态调整
- 避免中稿焦虑:相信均值回归,好工作不会被埋没。
- 不要迷信小红书投票:存在严重幸存者偏差。
- 每个投稿周期后放松一下:旅游、运动,保持身心健康。
八、工具与效率:善用 AI,提升科研生产力
大模型时代,动手能力比背公式更重要。
推荐工具:
AI 编程助手:GitHub Copilot、Cursor、Claude
可自动生成代码、解释逻辑、调试错误。LaTeX 写作:从 arXiv 下载源码,学习排版技巧。
学术搜索:
- https://info.arxiv.org/help/availability.html
了解 arXiv 提交时间与可见性。 - https://arxiv.org/localtime
查看 arXiv 更新的本地时间。
- https://info.arxiv.org/help/availability.html
结语:科研是取悦自己的成长
终于分享一句触动人心的话:
做科研是一种取悦自己的成长。
它不一直顺利,但每一次 debug、每一次写作、每一次 rebuttal,都是思维的锤炼。
记住:
- 质量 > 数量:一篇有影响力的工作,胜过十篇平庸之作。
- 合作 > 单打独斗:大模型时代,团队协作越来越主要。
- 保持好奇,抓住机遇:下一个突破,可能就在你下一次读论文时出现。
附录:科研资源汇总表
类别 | 资源 | 链接 |
---|---|---|
课程 | CS224N | https://web.stanford.edu/class/cs224n/ |
MIT 6.5940 | YouTube 搜索 | |
跟李沐学 AI | B站 | |
论文 | arXiv | https://arxiv.org/list/cs.CL/recent |
Papers with Code | https://papers.cool/arxiv/cs.CL | |
HuggingFace Papers | https://huggingface.co/papers/ | |
写作 | NLP 论文写作指南 | https://zhuanlan.zhihu.com/p/58752815 |
清华论文写作技巧 | https://nlp.csai.tsinghua.edu.cn/~ly/talks/cwmt14_tut.pdf | |
绘图 | Color Hunt(配色) | https://colorhunt.co/ |
IconFont(图标) | https://www.iconfont.cn/ | |
draw.io(绘图) | https://draw.io | |
工具 | GitHub 学生包 | https://github.com/education |
Rebuttal 指南 | 知乎搜索 |
:生活顺利,身心愉快。就是祝你科研顺利,Paper 多多,但更重要的
愿你在探索未知的路上,始终保持热爱与好奇。
本文灵感来源于一位连续发表顶会的研究者经验分享,经整理与匿名化处理,供学术社区参考。
如你也有经验愿分享,欢迎留言交流!
相关文章:
从零到顶会:NLP科研实战手册 - 实践
从零到顶会:NLP科研实战手册 - 实践pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", monospace !important;…...
单例模式
饿汉式(单例对象立即加载) 懒汉式(单例对象延时加载)...
apache修改默认位置
1、修改apache2.conf文件 <Directory 自定义目录/xx/xx/xx> Options Indexes FollowSymLinks AllowOverride None Require all granted</Directory> 2、修改sites-available/000-default.conf文件 #DocumentRoot /var/www/html DocumentRoot 自定义目录…...
实用指南:YOLOv11的旋转目标检测改进-(扩展检测头支持旋转框预测,适配遥感场景)
实用指南:YOLOv11的旋转目标检测改进-(扩展检测头支持旋转框预测,适配遥感场景)pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", &q…...
肝不好能喝酒吗
一般肝脏不好的患者不建议喝酒,可能会加重不适症状,影响健康。 肝脏是人体的重要器官,负责处理和代谢许多物质。如果肝脏不健康或受损,饮酒可能会产生负面影响,并导致一系列不适症状,甚至加重肝脏疾病。因此肝脏不好的人群不建议饮酒,以免对身体健康造成不良影响。 酒精…...
ROS中如何将日志格式设置为行号的形式
export RCUTILS CONSOLE OUTPUT FORMAT=[{function name}:{line_number}]:{message}...
USB相关的sysfs文件(重要的)【转】
https://www.cnblogs.com/linhaostudy/p/18388902 阅读目录前言 目录内容详解常见的 USB 相关目录及其含义1. /sys/bus/usb 目录下的含义1.1 /sys/bus/usb/devices/usb11-0:1.0 1-1.1:1.0结构图 设备信息bDeviceClass version busnum & devnum dev bMaxPower idVendor &…...
25上第一周
《数学之美》第三章以“语言模型与中文信息处理”为核心,通过讲述统计语言模型如何破解中文分词、语音识别等难题,展示了数学在解决复杂问题时的优雅与力量。作者用“马尔可夫链”将看似无序的汉字序列转化为可计算的概率问题,这种化繁为简的思维令我得到了许多感悟。尤其当…...
深入解析:RxJava在Android中的应用
深入解析:RxJava在Android中的应用pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", monospace !important; …...
模型选择与配置说明
模型选择与配置说明(Detection / Recognition / Classification) 本文系统说明本项目在“检测(det)/识别(rec)/分类(cls)”三条子任务上的模型选择思路、备选方案对比、输入尺寸与性能取舍、部署格式(ONNX/MNN)、以及在 GUI 与代码层面的配置方式。目标是让读者理解“…...
梯度下降算法
Gradient Descent 梯度下降一、核心思想:一个最经典的比喻 想象一下,你是一个蒙着眼睛的登山者,被困在一片漆黑的山林中。你的目标是走到山谷的最低点(寻找最低点)。 你会怎么做?你会用脚感受一下周围的地面,找出哪个方向是“下坡”最陡的。然后朝着那个最陡的下坡方向迈…...
002_文本分类任务的问答
1、下面代码中,random_state作为随机种子作用是什么? train_x, valid_x, train_y, valid_y = model_selection.train_test_split(trainDF[text], trainDF[label], test_size=0.25, random_state=42)这段代码的作用是随机把数据分为两个部分 计算机的“随机数”其实是 伪随机数…...
车牌识别
车牌识别方案对比与实现总结(GUI 三方法:lock / test / rec2) 本文面向实际工程应用,系统梳理当前 GUI 集成的三种车牌识别方法(lock、test、rec2)的技术亮点、设计思路、模型选择、实现过程与关键代码,帮助快速理解与持续优化。目标是:在统一界面中,对比“传统候选+文…...
告别人工标注瓶颈!Reward-RAG:用 CriticGPT 打造更懂人类偏好的检索模型
Reward-RAG: Enhancing RAG with Reward Driven Supervision 全文摘要 本文介绍了一种名为Reward-RAG的新方法,旨在通过奖励驱动监督增强Retrieval-Augmented Generation(RAG)模型。与以往的RAG方法不同,该方法使用了CriticGPT训练了一个专门的奖励模型,并利用该模型生成合…...
在AI技术快速实现创想的时代,挖掘前端学习新需求成为关键——某知名编程教育平台需求洞察
本文分析了一个包含50个前端项目的编程学习资源,涵盖交互设计、动画效果和实用工具等多种类型,通过用户反馈发现了界面优化、功能扩展和教学改进等方面的潜在需求。a.内容描述 该项目是一个包含50个独立前端项目的编程学习资源,核心功能定位在于通过实际项目练习帮助开发者掌…...
Latex 中百分号怎么打
Latex 中百分号怎么打 由于 % 被用作注释符,所以前面 + \ 进行转义 \(\frac{285.5}{1-2.7\%}\)...
文件上传-条件竞争绕过
条件竞争原理: 条件竞争的逻辑是代码逻辑问题:当我们文件上传到服务器时,先对文件进行保存,然后对文件的后缀名进行判断,符合白名单的保存,不符合就删除,但在删除之前,有另一个对服务器发起的请求,要访问这个文件,那么就可能造成文件被读取和访问。这就是条件竞争。 …...
9.17 CSP-S模拟23/多校A层冲刺NOIP2024模拟赛19 改题记录
HZOJ 写在前面 连着三天吃三坨。本来想着今天大凶忌参加模拟赛然后没模拟赛挺好的,然后7:57临时通知加场,难道这就是大凶?好吧打就打吧,没想到真差点爆零。粗看没一道题可做怀疑自己的水平了然后赛后猛然醒悟是自己蠢如猪。其实这篇前面应该还有两篇,但是奈何这套改完得比…...
C++ 并发
C++ 并发编程是现代软件开发中的核心技术,主要用于利用多核处理器提升程序性能。C++11 及后续标准引入了完善的并发库(<thread>、<mutex>、<condition_variable> 等),使开发者能更安全地编写多线程程序。 1、std::thread std::thread 是 C++11 引入的线程…...
UML 5章
UML是建模语言,能够用面向对象的方法描述任何类型的系统 UML时序图:他通过对象之间发送消息的时间顺序显示多个对象之间的动态协作,重在对象之间的交互,强调时间顺序例UML状态图例...
《微服务事务管理》 - 教程
《微服务事务管理》 - 教程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", monospace !important; font-siz…...
python之socket udp服务器实现
import socket# 1. 创建 UDP Socket (SOCK_DGRAM 表示 UDP) receiver_socket = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)# 2. 绑定地址和端口 receiver_address = (, 1883) # 端口号 9999 receiver_socket.bind(receiver_address)print("UDP 接收方已启动,等待…...
kylin SP3安装mysql 8.4.5
环境:OS:kylin SP3mysql:8.4.5 glibc2.17,建议安装glibc.2.28版本 查看系统glibc版本[root@localhost ~]# ldd --versionldd (GNU libc) 2.28Copyright (C) 2018 自由软件基金会。这是一个自由软件;请见源代码的授权条款。本软件不含任何没有担保;甚至不保证适销性或者适合某…...
Unity中是否可以禁用GC
1)Unity中可以禁用GC吗2)项目是URP管线,渲染模块CPU耗时高,经排查主要是Batches数过高,应怎样进一步排查和优化渲染批次这是第445篇UWA技术知识分享的推送,精选了UWA社区的热门话题,涵盖了UWA问答、社区帖子等技术知识点,助力大家更全面地掌握和学习。 UWA社区主页:co…...
经典SQL语句大全
经典SQL语句大全一、基础1、说明:创建数据库CREATE DATABASE database-name2、说明:删除数据库drop database dbname3、说明:备份sql server--- 创建 备份数据的 deviceUSE masterEXEC sp_addumpdevice disk, testBack, c:\mssql7backup\MyNwind_1.dat--- 开始 备份BACKUP D…...
IvorySQL 与 deepin 完成兼容性认证,共创开源生态新篇章
近日,IvorySQL 与 deepin 操作系统成功完成了兼容性适配认证。这一里程碑式的成就标志着 IvorySQL 在国产操作系统生态中的进一步深化,为用户提供更稳定、高效的数据库解决方案。deepin 简介 深度操作系统 deepin 是一款以“简洁、美观、易用”著称的国产 Linux 发行版,拥有…...
在 Nginx 上搭建静态站点
1、新建站点的配置文件 vi /etc/nginx/conf.d/www.xxx.com.conf2、写入如下内容: server {listen 80;#listen [::]:80;server_name www.xxx.com; # 这里可以写你的域名,或者 _ 表示匹配所有 root /var/www/www.xxx.com; # 你的静态文件目录 index index.html index.htm;locat…...
使用GitHub Dork快速发现漏洞:我的第一个Bugcrowd漏洞挖掘实战
本文详细介绍了如何通过GitHub Dork技术快速发现企业敏感信息泄露漏洞,包含实用的搜索语法和实际案例,帮助安全研究人员高效挖掘漏洞。使用GitHub Dork快速发现漏洞:我的第一个Bugcrowd漏洞挖掘实战 嗨,黑客们,漏洞猎人们! 祝愿你们发现大量漏洞并获得丰厚奖励! 虽然距离…...
kylin SP3安装mysql8.0.41
环境:OS:kylin SP3mysql:8.0.41 glibc2.17,建议安装glibc.2.28版本 查看系统glibc版本[root@localhost ~]# ldd --versionldd (GNU libc) 2.28Copyright (C) 2018 自由软件基金会。这是一个自由软件;请见源代码的授权条款。本软件不含任何没有担保;甚至不保证适销性或者适合某…...
DIFY 项目中通过 Makefile 调用 Dockerfile 并采用 sudo make build-web 命令构建 web 镜像的方法和注意事项
DIFY 项目中通过 Makefile 调用 Dockerfile 并采用 sudo make build-web 命令构建 web 镜像的方法和注意事项pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas",…...
代码随想录算法训练营第一天 | 704. 二分查找、27. 移除元素、209.长度最小的子数组
704. 二分查找 思路:刷过很多次了,就是双指针思想,初始化一个在数组最左边的指针index_l,一个在最右边的指针index_r,当index_l < index_r 的时候通过判断index_l 和 index_r所确定的区间,缩小区间,最后夹逼出我们的目标值。 注意的点:最终状态会有两个 :1.l与r相等…...
从 MLPerf Storage v2.0 看 AI 训练中的存储性能与扩展能力
8 月 5 日,全球权威 AI 工程联盟 MLCommons 发布了最新的 MLPerf Storage v2.0 基准测试结果。本次评测吸引了众多厂商参与,包括 Cloud、Shared File、Fabric-Attached Block、Direct-Attached Block 这几大类存储厂商。 由于各厂商在硬件配置、节点规模和应用场景上的差异,…...
Revit二次开发 钢筋生成API(二)
2、自由钢筋生成API 创建一条无约束的自由形状钢筋。之后无法对该钢筋添加约束。public static Rebar CreateFreeForm(Document doc,RebarBarType barType,Element host,IList<IList<Curve>> curves,out RebarFreeFormValidationResult error )这个合自由钢筋生成A…...
创建会计凭证报错:FI/CO接口:待更新的不一致的FI/CO凭证标题数据(转)
问题:使用过账BAPI_ACC_DOCUMENT_POST,自动过账时,报错原因是“FI/CO接口:待更新的不一致的FI/CO凭证标题数据”。 原因: 1、如果头数据里面的公司和行项目公司是一致的,检查行项目,不要对行项目赋公司bukrs。 "it_item-comp_code = wa_account-bukrs. 2、检查金额是…...
Uri uri = new Uri(Path); 这行代码的作用
1. 语法校验 字符串里只要多一个空格、少一个 /、中文没转义,后面 HttpClient 会直接炸。 Uri 构造函数会第一时间给你抛 UriFormatException,早发现早处理。 2. 把“一串字符”升级成“有结构的零件箱” 转成 Uri 后,你就能直接拿这些字段,而不用再 Substring、IndexOf 去…...
Qt函数方法传入参数未使用-警告warning错误error提示解决
前言全局说明某些情况下,函数(方法)会传入参数,但并不一定会使用, 但是,不使用编辑器又会警告一、说明 1.1 环境: Windows 7 旗舰版 Visual Studio 2013二、未使用参数解决 原型 Q_UNUSED(未使用参数)三、示例 3.1 文件名: public:MyThread(QWidget *parent = nullptr){Q_…...
mysql 性能监控,关键指标解析与优化案例剖析
你是否经历过数据库突然变慢却无从下手的困境?某金融平台曾因慢查询堆积导致交易响应暴增300%,某电商大促期间因缓冲池命中率骤降引发订单延迟。性能问题往往具备隐蔽性和突发性特征,本文将揭示MySQL监控的核心参数与实战诊断方法。 连接池监控是性能防护的第一道防线。Thre…...
设计模式
1.分类 创建型模式,共五种:工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。 结构型模式,共七种:适配器模式、装饰器模式、代理模式、外观模式、桥接模式、组合模式、享 元模式。 行为型模式,共十一种:策略模式、模板方法模式、观察者模式、迭代子模式、责…...
Rhinoceros 8.23.25251.13001 犀牛3D建模
描述 Rhinoceros 是由美国Robert McNeel公司最新出品的专业强大的3D建模软件。软件以集百家之长为一体的发展教育理念,拥有NURBS的优秀传统建模教学方法,也有一个网格进行建模插件T-Spline,使建模方式方法有了更多的挑选,然后能创建出更传神、生动的造型。能输入和输出几十…...
Git 常用操作指南
本文为你整理了 Git 的常用操作,无论你是刚接触 Git 还是需要快速查阅,这篇指南都能帮你高效管理代码版本。 🔧 初始配置 开始使用 Git 前,先配置你的用户信息: git config --global user.name "你的用户名" git config --global user.email "你的邮箱&qu…...
《深入理解计算机系统》计算机系统漫游(一) - Invinc
本文记录《深入理解计算机系统》中第1章 计算机系统漫游 的一些知识点。本文记录《深入理解计算机系统》中第1章 计算机系统漫游 的一些知识点。第1章 计算机系统漫游 信息就是位+上下文 系统中所有的信息——包括磁盘文件、内存中的程序、内存中存放的用户数据以及网络上传送的…...
从几何分离到语义理解:深度解析3D点云分割与语义分割的本质区别
在三维计算机视觉领域,3D点云作为真实世界场景的核心数据载体,其处理技术直接决定了机器感知环境的精度与效率。 其中,3D点云分割与语义分割是两类关键技术,尽管二者同属点云处理范畴,但在目标定位、信息输出与应用价值上存在本质差异。 前者专注于“几何层面的分离”,通…...
欧拉筛(线性筛)算法分析
前言对于寻找素数,第一时间想到的便是二重循环暴力查找,其复杂度O(n^2),通过循环中只判断到根号n可以优化一些,不过复杂度也达不到预期。在数论的学习中,我学到了埃氏筛法,O(nloglogn)的算法,而在一些数据范围达到1e7这样的题目中,也很难让人满意,于是我便学习了欧拉筛…...
2021年安徽省大数据与人工智能应用竞赛 大数据(网络赛)-高职组赛题
本套数据数据: 通过网盘分享的文件: 链接: https://pan.baidu.com/s/1ZQXoWQhCOAiGVcFOZozV1g?pwd=json 提取码: json 第二部分:大数据程序编写部分(30分) 任务一、数据抽取转化部分(5分) 1、使用sqoop将MySQL的sakila数据库中的city表中city列以C开头的数据导入到hdfs…...
Alexandresku设计的loki小对象内存分配器
Loki是由 Alexandresku 编写的一个与《Modern C++ Design》(C++设计新思维)一书配套发行的C++代码库。其中有两个文件 SmallObj.h 、SmallObj.cpp 进行内存管理,可以单独进行使用 三个class,第一层是chunk,第二层是vector<chunk> FixedAllocator,第三层是vector&l…...
C++ 内存管理
C++ 内存管理是程序设计的核心环节,直接影响程序的性能、稳定性和安全性。C++ 不像 Java、Python 等语言有自动垃圾回收机制,而是需要开发者手动管理动态内存(或通过智能指针等机制自动管理)。 1、C++ 内存分区内存区域 存储内容 生命周期 管理方式栈 (Stack) 函数参数、局…...
一些写了和没写的数学!
P8114 [Cnoi2021] 六边形战士 传送 非常好玩的题! 首先你大概率看过一些“无字证明”,其中很经典的是这个: 证明:用若干个边长为 \(1\),顶角为 \(60\) 度的菱形拼成一个边长为 \(n\) 的正六边形,三个方向的菱形个数一定相等。这是一个经典的无字证明,虽然前置的说明要费…...
【光照】[自发光Emission]以UnityURP为例
【从UnityURP开始探索游戏渲染】专栏-直达自发光的基本原理 $Cemissive=Memissive$ 自发光是物体表面主动发射光线的现象,在光照模型中通常作为独立于外部光源的附加项。其核心特点是不受其他光照影响,但可以影响周围环境。 实现流程定义发射颜色和强度:确定基础发光颜色…...
mybatis-plus初体验,解决报错Invalid value type for attribute factoryBeanObjectType: java.lang.String
解决报错Invalid value type for attribute factoryBeanObjectType: java.lang.String 推荐这位大佬的博客: https://www.cnblogs.com/muphy/p/18653627 项目结构MyBatis-Plus配置类MyBatisPlusConfig package com.example.config;import com.baomidou.mybatisplus.annotation…...
浅谈制氢电源及英飞凌解决方案
大家对氢元素肯定都不陌生,认识它基本都是从背元素周期表开始的。近年来我们身边多了很多氢的身影,从北京冬奥会的氢燃料电池大巴,再到广州南沙小虎岛电氢智慧能源站,氢也越来越被大家熟知。工业上,氢的使用可是一点都不少,自 1975 年以来,需求量增长了三倍,而且还在继…...