当前位置: 首页 > news >正文

一个很简单的机器学习任务

一个很简单的机器学习任务

前言

基于线上colab做的一个简单的案例,应用了线性回归算法,预测了大概加州3000多地区的房价中位数

过程

先导入了Pandas,这是一个常见的Python数据处理函数库

Pandasread_csv函数把网上一个共享数据集(csv文件)读入DataFrame数据结构df_housing

这个文件是加州某个时期的房价数据集

DataFrame数据结构的head方法显示数据集中的部分信息

import pandas as pd
df_housing = pd.read_csv("https://raw.githubusercontent.com/huangjia2019/house/master/house.csv")
df_housing.head()

结果如下在这里插入图片描述

在这里插入图片描述

然后构建特征集x和特征集y

x = df_housing.drop("median_house_value",axis=1) #构建特征集x
y = df_housing.median_house_value #构建特征集y

现在把数据集一分为二,80%用于机器训练(训练数据集),剩下的留着做测试(测试数据集)

from sklearn.model_selection import train_test_split #导入sklearn工具库
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.2,random_state=0) #以80%/20%的比例进行数据集的拆分

接下来开始训练机器,首先选择模型的类型,也就是算法

然后通过其中的fit方法来训练机器,进行函数的拟合

拟合意味着找到最优的函数去模拟训练集中的输入(特征)和目标(标签)的关系,这是确定模型的参数

from sklearn.linear_model import LinearRegression #导入线性回归算法模型
model = LinearRegression() #确定线性回归算法
model.fit(x_train,y_train) #根据训练集数据,训练机器,拟合函数
y_pred = model.predict(x_test) #预测验证集的y值
print('房价的真值(测试集)',y_test)
print('预测的真值(测试集)',y_pred)

显示预测可以多少评分

print('给预测评分',model.score(x_test,y_test)) #评估预测分数

也可以画出来

import matplotlib.pyplot as plt
#用散点图显示家庭收入中位数和房价中位数的分布
plt.scatter(x_test.median_income,y_test,color='brown')
#画出回归函数(从特征到预测标签)
plt.plot(x_test.median_income,y_pred,color='blue',linewidth=2)
plt.xlabel('median Income')
plt.ylabel('median House Value')
plt.show()

在这里插入图片描述

可以看出各个地区的平均房价中位数有随该地区家庭收入中位数的上升而增加的趋势,而机器学习到的函数也同意体现了着一点

后记

学习产出记录

相关文章:

一个很简单的机器学习任务

一个很简单的机器学习任务 前言 基于线上colab做的一个简单的案例,应用了线性回归算法,预测了大概加州3000多地区的房价中位数 过程 先导入了Pandas,这是一个常见的Python数据处理函数库 用Pandas的read_csv函数把网上一个共享数据集&…...

ORION:通过视觉-语言指令动作生成的一个整体端到端自动驾驶框架

25年3月来自华中科技和小米电动汽车的论文“ORION: A Holistic End-to-End Autonomous Driving Framework by Vision-Language Instructed Action Generation”。 由于因果推理能力有限,端到端 (E2E) 自动驾驶方法仍然难以在交互式闭环评估中做出正确决策。当前的方…...

python全栈-flask

python全栈-flask 文章目录 入门上手hello worldflask运行方式测试路由with app.test_request_context():debug模式配置flask参数动态路由数据类型自定义转换器to_pythonPostMan(API测试查询参数的获取请求体参数上传文件其它参数url_for 函数重定向响应内容自定义响…...

Unity中的数字孪生项目:两种输入方式对观察物体的实现

在数字孪生项目中,精确的相机控制至关重要。相机不仅需要灵活地跟随目标,还要能够平滑地旋转和缩放,以便观察和分析物体的各个细节。今天,我将通过 TouchControlCamera 和 CameraRotate 两个脚本,展示如何实现一个适用…...

ECharts散点图-散点图14,附视频讲解与代码下载

引言: ECharts散点图是一种常见的数据可视化图表类型,它通过在二维坐标系或其它坐标系中绘制散乱的点来展示数据之间的关系。本文将详细介绍如何使用ECharts库实现一个散点图,包括图表效果预览、视频讲解及代码下载,让你轻松掌握…...

【教程】Digispark实现串口通信

转载请注明出处&#xff1a;小锋学长生活大爆炸[xfxuezhagn.cn] 如果本文帮助到了你&#xff0c;欢迎[点赞、收藏、关注]哦~ 没想到这么老&#xff0c;很多代码都不能用&#xff0c;修了好久。。。 TinySoftwareSerial.cpp #include <stdlib.h> #include <stdio.h&g…...

GPT-4.1 开启智能时代新纪元

GPT-4.1 全解析&#xff1a;开启智能时代新纪元&#xff08;含费用详解&#xff09; 2025年4月&#xff0c;OpenAI 正式推出全新一代语言模型——GPT-4.1 系列&#xff0c;包括 GPT-4.1、GPT-4.1 Mini 和 GPT-4.1 Nano。相比以往模型&#xff0c;它在代码生成、指令理解、长文本…...

4.21 spark和hadoop的区别与联系

一、Hadoop 1. 定义 Hadoop是一个由Apache基金会开发的分布式系统基础架构。它最初是为了解决大规模数据存储和处理的问题而设计的。Hadoop的核心组件包括HDFS&#xff08;Hadoop Distributed File System&#xff09;和MapReduce。 2. HDFS&#xff08;Hadoop Distributed Fi…...

Nacos 客户端 SDK 的核心功能是什么?是如何与服务端通信的?

Nacos 客户端 SDK 的核心功能 Nacos 客户端 SDK 是应用程序集成 Nacos 能力的桥梁&#xff0c;它封装了与 Nacos 服务端交互的复杂性&#xff0c;为开发者提供了简单易用的 API。其核心功能主要围绕两大方面&#xff1a;服务发现 和 配置管理。 服务发现 (Service Discovery) …...

servlet-保存作用域

保存作用域 保存作用域&#xff1a;原始情况下&#xff0c;保存作用域我们有四个&#xff1a;page(一般不用了) 、request&#xff08;一般请求响应范围&#xff09;、session(一次会话范围)、application(整个应用程序范围)1&#xff09;request&#xff1a;一般请求响应范围…...

从规则到大模型:知识图谱信息抽取实体NER与关系RE任务近10年演进发展详解

摘要&#xff1a; 本文回顾了关系抽取与实体抽取领域的经典与新兴模型&#xff0c;清晰地梳理了它们的出现时间与核心创新&#xff0c;并给出在 2025 年不同资源与场景下的最佳实践推荐。文章引用了 BiLSTM‑CRF、BiLSTM‑CNN‑CRF、SpanBERT、LUKE、KnowBERT、CasRel、REBEL、…...

【自然语言处理与大模型】模型压缩技术之蒸馏

知识蒸馏是一种模型压缩技术&#xff0c;主要用于将大型模型&#xff08;教师模型&#xff09;的知识转移到更小的模型&#xff08;学生模型&#xff09;中。在大语言模型领域&#xff0c;这一技术特别重要。 知识蒸馏的核心思想是利用教师模型的输出作为软标签&#xff08;sof…...

yum如果备份已经安装的软件?

在 CentOS 系统中&#xff0c;你可以通过以下步骤将 yum 下载的组件打包备份到本地&#xff1a; 方法 1&#xff1a;使用 yumdownloader 直接下载 RPM 包 1. 安装 yum-utils 工具 yum install -y yum-utils2. 下载指定软件包及其依赖 yumdownloader --resolve <package-n…...

室外摄像头异常自检指南+视频监控系统EasyCVR视频质量诊断黑科技

室外监控摄像头在安防监控系统运行中&#xff0c;常出现连接不畅、设备互认失败等问题。今天我们来介绍两类安防监控摄像头的典型问题及排查步骤。 问题1&#xff1a;同品牌新摄像头无法被老录像机识别 排查步骤&#xff1a; 1&#xff09;供电检查 确认摄像头供电线路连接正…...

从本地存档到协作开发的Git简单使用

概念 工作区 : 在本地实际进行文件操作的目录 .暂存区 : 类似于缓冲区 , 用于记录准备进行下一次提交的内容 .本地仓库 : 储存在本地的完整版本库 , 包含项目的提交历史 , 分支信息和标签等 .远程仓库 : 部署在远程服务器的版本库 , 通常用于协作开发 . 文件状态 Untracked …...

在 Android 中实现通话录音

在 Android 中实现通话录音需要处理系统权限、通话状态监听和音频录制等关键步骤。以下是详细实现代码及注释&#xff0c;注意不同 Android 版本和厂商设备的兼容性问题&#xff1a; 1. 添加权限声明&#xff08;AndroidManifest.xml&#xff09; <!-- 录制音频权限 -->…...

系统分析师知识点:访问控制模型OBAC、RBAC、TBAC与ABAC的对比与应用

在信息安全领域&#xff0c;访问控制是确保数据和资源安全的关键技术。随着信息系统复杂度的提高&#xff0c;访问控制技术也在不断演进&#xff0c;从早期简单的访问控制列表(ACL)发展到如今多种精细化的控制模型。本文将深入剖析四种主流的访问控制模型&#xff1a;基于对象的…...

网络原理(TCP协议—协议格式,性质(上),状态)

目录 1.TCP协议段格式。 2.TCP协议传输时候的性质。 2.1确认应答。 2.2超时重传。 2.3连接管理。 2.3.1 三次握手。 2.3.2四次挥手。 3.TCP常见的状态。 1.TCP协议段格式。 TCP协议段是由首部和数据两部分构成的。首部包含了TCP通信所需要的各种控制信息&#xff0c;而…...

用全新发布的ChatGPT-o3搜文献写综述、专业审稿、降重润色,四个步骤轻松搞定全部论文难题!

今天和大家聊聊OpenAI近期发布的o系列模型中的两个大成果:o3和o4-mini,这个系列的模型最大特点是经过训练,会在响应之前进行更长时间的思考,给出更深入的回答。 下面文章七哥会为大家深度讲解o3模型在学术研究和论文写作方面的四大优势,并附上实用有效的使用技巧和步骤供…...

多路由器通过RIP动态路由实现通讯(单臂路由)

多路由器通过RIP动态路由实现通讯&#xff08;单臂路由&#xff09; R1(开启端口并配置IP) Router>en Router#conf t Router(config)#int g0/0 Router(config-if)#no shu Router(config-if)#no shutdown Router(config-if)#ip add 192.168.10.254 255.255.255.0 Router(c…...

分数线降低,25西电马克思主义学院(考研录取情况)

1、马克思主义学院各个方向 2、马克思主义学院近三年复试分数线对比 学长、学姐分析 由表可看出&#xff1a; 1、马克思主义理论25年相较于24年下降10分&#xff0c;为355分 3、25vs24推免/统招人数对比 学长、学姐分析 由表可看出&#xff1a; 1、 马克思主义学院25年共接…...

反转字符串

344. 反转字符串 题目 思路 双指针 设 s 长度为 n。反转可以看成是交换 s[0] 和 s[n−1]&#xff0c;交换 s[1] 和 s[n−2]&#xff0c;交换 s[2] 和 s[n−3]&#xff0c;依此类推。 代码 class Solution:def reverseString(self, s: List[str]) -> None:""&q…...

乾元通渠道商中标舟山市自然灾害应急能力提升工程基层防灾项目

近日&#xff0c;乾元通渠道商中标舟山市自然灾害应急能力提升工程基层防灾项目&#xff08;结余资金&#xff09;装备采购项目&#xff0c;乾元通作为设备厂家&#xff0c;为项目提供通信指挥类装备&#xff08;多链路聚合设备&#xff09;QYT-X1。 青岛乾元通数码科技有限公司…...

‌信号调制与解调技术基础解析

调制解调技术是通信系统中实现基带信号与高频载波信号相互转换的主要技术&#xff0c;通过调整信号特性使其适应不同信道环境&#xff0c;保障信息传输的效率和可靠性。 调制与解调的基本概念 调制&#xff08;Modulation&#xff09;‌ 将低频基带信号&#xff08;如语音或数…...

多源异构网络安全数据(CAPEC、CPE、CVE、CVSS、CWE)的作用、数据内容及其相互联系的详细分析

1. CWE&#xff08;Common Weakness Enumeration&#xff09; 作用&#xff1a;CWE 是常见软件和硬件安全弱点的分类列表&#xff0c;用于描述漏洞的根本原因&#xff08;如代码缺陷、逻辑错误等&#xff09;&#xff0c;为漏洞的根源分析提供框架。数据内容&#xff1a; 弱点…...

02_Flask是什么?

一、视频教程 02_Flask是什么 二、Flask简介 Flask 框架诞生于2010 年&#xff0c;是由 Armin 使用 Python 语言基于 Werkzeug 工具箱编写的轻量级Web开发框架。Armin 是 Python 编程语言的核心开发者之一&#xff0c;同时也是 Flask 项目的主要贡献者。 Flask主要依赖于两个核…...

突破网页数据集获取难题:Web Unlocker API 助力 AI 训练与微调数据集全方位解决方案

突破网页数据集获取难题&#xff1a;Web Unlocker API 助力 AI 训练与微调数据集全方位解决方案 背景 随着AI技术的飞速发展&#xff0c;诸如DeepSeek R1、千问QWQ32、文小言、元宝等AI大模型迅速崛起。在AI大模型训练和微调、AI知识库建设中&#xff0c;数据集的获取已成为不…...

Spark-SQL与Hive集成及数据分析实践

一、Spark-SQL连接Hive的配置 Spark-SQL支持与Hive无缝集成&#xff0c;可通过以下方式操作Hive&#xff1a; 1. 内嵌Hive&#xff1a;无需额外配置&#xff0c;直接使用&#xff0c;但生产环境不推荐。 2. 外部Hive&#xff1a; 将hive-site.xml、core-site.xml、hdfs-site…...

CI/CD

CI/CD 是一种用于软件开发和交付的实践方法&#xff0c;由持续集成&#xff08;Continuous Integration&#xff09;、持续交付&#xff08;Continuous Delivery&#xff09;和持续部署&#xff08;Continuous Deployment&#xff09;三个关键环节组成&#xff0c;以下是具体介…...

【橘子大模型】Tools/Function call

一、简介 截止目前&#xff0c;我们对大模型的使用模式仅仅是简单的你问他答。即便是拥有rag&#xff0c;也只是让大模型的回答更加丰富。但是大模型目前为止并没有对外操作的能力&#xff0c;他只是局限于他自己的知识库。 举个例子&#xff0c;到今天4.21为止&#xff0c;你…...

解决Mac 安装 PyICU 依赖失败

失败日志&#xff1a; 解决办法 1、使用 homebrew 安装相关依赖 brew install icu4c 安装完成后&#xff0c;设置环境变量 echo export PATH"/opt/homebrew/opt/icu4c77/bin:$PATH" >> ~/.zshrcecho export PATH"/opt/homebrew/opt/icu4c77/sbin:$PATH…...

Kafka 生产者的幂等性与事务特性详解

在分布式消息系统中&#xff0c;消息的可靠性传输是一个核心问题。Kafka 通过幂等性&#xff08;Idempotence&#xff09;和事务&#xff08;Transaction&#xff09;两个重要特性来保证消息传输的可靠性。幂等性确保在生产者重试发送消息的情况下&#xff0c;不会在 Broker 端…...

ubuntu--汉字、中文输入

两种输入框架的安装 ibus 链接 (这种方式安装的中文输入法不是很智能&#xff0c;不好用)。 Fcitx 链接这种输入法要好用些。 简体中文检查 fcitx下载和配置 注意&#xff1a;第一次打开fcitx-config-qt或者fcitx configuration可能没有“简体中文”&#xff0c;需要把勾…...

LabVIEW 开发中数据滤波方式的选择

在 LabVIEW 数据处理开发中&#xff0c;滤波是去除噪声、提取有效信号的关键环节。不同的信号特性和应用场景需要匹配特定的滤波方法。本文结合典型工程案例&#xff0c;详细解析常用滤波方式的技术特点、适用场景及选型策略&#xff0c;为开发者提供系统性参考。 ​ 一、常用…...

【图像轮廓特征查找】图像处理(OpenCV) -part8

17 图像轮廓特征查找 图像轮廓特征查找其实就是他的外接轮廓。 应用&#xff1a; 图像分割 形状分析 物体检测与识别 根据轮廓点进行&#xff0c;所以要先找到轮廓。 先灰度化、二值化。目标物体白色&#xff0c;非目标物体黑色&#xff0c;选择合适的儿值化方式。 有了轮…...

丝杆升降机蜗轮蜗杆加工工艺深度解析:从选材到制造的全流程技术要点​

在机械传动领域&#xff0c;丝杆升降机凭借其高精度、大负载等优势&#xff0c;广泛应用于自动化设备、精密仪器等众多场景。而蜗轮蜗杆作为丝杆升降机的核心传动部件&#xff0c;其加工工艺的优劣直接决定了设备的传动效率、使用寿命及稳定性。本文将深入剖析丝杆升降机蜗轮蜗…...

git远程分支重命名(纯代码操作)

目录 步骤 1&#xff1a;重命名本地分支 步骤 2&#xff1a;推送新分支到远程 简单讲讲&#xff1a; 2.1.-u 和 --set-upstream 的区别 2.2. 为什么需要设置上游&#xff08;upstream&#xff09;&#xff1f; 示例对比&#xff1a; 2.3. 如何验证是否设置成功&#xff…...

《AI大模型应知应会100篇》第31篇:大模型重塑教育:从智能助教到学习革命的实践探索

第31篇&#xff1a;大模型重塑教育&#xff1a;从智能助教到学习革命的实践探索 摘要 当北京大学的AI助教在凌晨三点解答学生微积分难题&#xff0c;当Khan Academy的AI导师为每个学生定制专属学习路径&#xff0c;我们正见证教育史上最具颠覆性的技术变革。本文通过真实教育…...

安装Github软件详细流程,win10系统从配置git到安装软件详解,以及github软件整合包制作方法(

win10系统部署安装开源ai必备 一、安装git应用程序&#xff08;用来下来github软件&#xff09; 官网下载git的exe可执行文件&#xff0c;Git - Downloads 或者这里下夸克网盘分享 运行git应用程序&#xff0c;一路’Next’到底即可。 配置安装路径 此时如果直接运行git命…...

重构・协同・共生:传统代理渠道数字化融合全链路解决方案

当 90 后经销商开始用直播卖家电&#xff0c;当药品流向数据在区块链上实时流转&#xff0c;传统代理渠道正在经历一场「数字觉醒」。面对流量碎片化、运营低效化的行业痛点&#xff0c;如何让扎根线下数十年的渠道网络&#xff0c;在数字化平台上焕发新生&#xff1f;蚓链提炼…...

智驱未来:AI大模型重构数据治理新范式

第一章 数据治理的进化之路 1.1 传统数据治理的困境 在制造业巨头西门子的案例中&#xff0c;其全球200个工厂每天产生1.2PB工业数据&#xff0c;传统人工清洗需要300名工程师耗时72小时完成&#xff0c;错误率高达15%。数据孤岛问题导致供应链决策延迟平均达48小时。 1.2 A…...

信息收集之hack用的网络空间搜索引擎

目录 1. Shodan 2. Censys 3. ZoomEye 4. BinaryEdge 5. Onyphe 6. LeakIX 7. GreyNoise 8. PulseDive 9. Spyse 10. Intrigue 11. FOFA (Finger Of Find Anything) 12. &#x1f50d; 钟馗之眼 (ZoomEye) 总结 对于黑客、网络安全专家和白帽子工程师来说&#xf…...

青少年编程与数学 02-018 C++数据结构与算法 01课题、算法

青少年编程与数学 02-018 C数据结构与算法 01课题、算法 一、算法的定义二、算法的设计方法1. 分治法2. 动态规划法3. 贪心算法4. 回溯法5. 迭代法6. 递归法7. 枚举法8. 分支定界法 三、算法的描述方法1. **自然语言描述**2. **流程图描述**3. **伪代码描述**4. **程序设计语言…...

LangChain、LlamaIndex 和 ChatGPT 的详细对比分析及总结表格

以下是 LangChain、LlamaIndex 和 ChatGPT 的详细对比分析及总结表格&#xff1a; 1. 核心功能对比 工具核心功能LangChain框架&#xff0c;用于构建端到端的 LLM 应用程序&#xff0c;支持 prompt 工程、模型调用、数据集成、工具链开发。LlamaIndex文档处理工具&#xff0c…...

基于单片机的BMS热管理功能设计

标题:基于单片机的BMS热管理功能设计 内容:1.摘要 摘要&#xff1a;在电动汽车和储能系统中&#xff0c;电池管理系统&#xff08;BMS&#xff09;的热管理功能至关重要&#xff0c;它直接影响电池的性能、寿命和安全性。本文的目的是设计一种基于单片机的BMS热管理功能。采用…...

数字虹膜:无网时代的视觉密语 | 讨论

引言&#xff1a;当网络成为枷锁 在断网即失联的当下&#xff0c;我们是否过度依赖脆弱的网络线缆&#xff1f;当两台孤立设备急需交换数据&#xff0c;传统方案或受限于物理介质&#xff0c;或暴露于无线信号被劫持的风险。有没有可能绕过所有中间节点&#xff0c;让数据像光线…...

Kubernetes相关的名词解释Container(16)

什么是Container&#xff1f; 在 Kubernetes 中&#xff0c;Container&#xff08;容器&#xff09; 是一个核心概念&#xff0c;你可以将镜像&#xff08;Image&#xff09;类比为程序的“源代码”&#xff0c;而容器是这段“代码”运行时的进程。例如&#xff0c;一个 nginx…...

腾讯云×数语科技:Datablau DDM (AI智能版)上架云应用!

在数据爆炸式增长的时代&#xff0c;传统的数据建模方式已难以满足企业对敏捷性、智能化、自动化的需求。数语科技联合腾讯云推出的 Datablau DDM 数据建模平台&#xff08;AI智能版&#xff09;&#xff0c;基于AI语义建模技术&#xff0c;深度融合腾讯混元大模型能力&#xf…...

可穿戴设备待机功耗需降至μA级但需保持实时响应(2万字长文深度解析)

可穿戴设备的功耗与响应需求之矛盾 在过去十年中&#xff0c;可穿戴设备以惊人的速度融入我们的日常生活&#xff0c;成为现代科技与个人健康管理的重要交汇点。从智能手表到健身手环&#xff0c;从医疗监测设备到增强现实眼镜&#xff0c;这些设备不仅仅是科技产品的延伸&…...

【身份证扫描件识别表格】如何识别大量身份证扫描件将内容导出保存到Excel表格,一次性处理多张身份证图片导出Excel表格,基于WPF和腾讯云的实现方案

基于WPF和腾讯云的身份证扫描件批量处理方案 适用场景 本方案适用于需要批量处理大量身份证扫描件的场景,例如: 企业人事部门批量录入新员工身份信息银行或金融机构办理批量开户业务教育机构收集学生身份信息政府部门进行人口信息统计酒店、医院等需要实名登记的场所这些场景…...