admin 管理员组文章数量: 1086019
2024年3月8日发(作者:不四舍五入取整公式)
本文由我司收集整编,推荐下载,如有疑问,请与我司联系Python统计分析库statsmodels的OLS
2017/10/27 257 statsmodels库官方文档statsmodels/stable/,里面包含很多统计模型和相应计算结果;一些Linear Regression Models例子statsmodels/stable/examples/#regression
下面主要陈述常用的回归分析中的OLS:Ordinary Least Squares。 给定 组样本数据 (yi,x(i)1,x(i)2,⋯,x(i)n),i=1,2,⋯,k , 用 维一次多项式回归模型
以增广形式表出是为了和模块编写源码对应,OLS里的多项式回归模型是没有常数项的,因此这里将常数项看作基为
是用样本数据拟合出最小二乘最小的系数组合,即求 。
对上述 组样本数据进行最小二乘拟合,即最小化
的参数有endog, exog, missing, hasconst等 ,现在只考虑前两个。 第一个输入 endog 是回归模型中的因变量 y(x) , 输入是一个
的维度上的系数,OLS就(y1,y2,⋯,yk)T 。第二个输入 exog 是自变量,即 个样本点构成的 k×(n+1) 维数组
,因此为了使用OLS模型函数,需要在数组左侧加上一列 1,就需要使用statmodels库的add_constant()函数,该函数的参数就是因变量数组(上述 ),也就是数据分析中用到的具有物理含义的list、、ame;该函数的输出就如上述形式的
import pandas as pd # 读取数据到DataFrameimport urllib # 获取网络数据import
shutil # 文件操作import zipfile #
bike_data’)except:
压缩解压import os#
(‘rm -rf
建立临时目录try:
bike_data; mkdir (‘mkdir
bike_data’)data_source = ‘/ml/machine-learning-databases/00275/’ # 网络数据地址zipname = ‘bike_data/’ #
拼接文件和路径rieve(data_source, zipname) # 获得数据zip_ref =
e(zipname,
#zip_tall(temp_dir)
‘r’) # 创建一个ZipFile对象处理压缩文件# 解压
版权声明:本文标题:【IT专家】Python统计分析库statsmodels的OLS 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://roclinux.cn/p/1709907290a549731.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论