当前位置: 首页 > news >正文

上海当地网站免费大数据平台

上海当地网站,免费大数据平台,网站开发与运营方向,东营做网站优化公司一、理解DataFrame 他是一个表格结构:DataFrame 是一个表格型的数据结构 他是有序的,不同值类型:它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。 他可以被看做一个由series组成的…

一、理解DataFrame

他是一个表格结构:DataFrame 是一个表格型的数据结构

他是有序的,不同值类型:它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。

他可以被看做一个由series组成的字典:DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。

他对应二维数组:

Pandas DataFrame 是一个二维的数组结构,类似二维数组。

二、参数理解

pandas.DataFrame( data, index, columns, dtype, copy)
'''
data:一组数据(ndarray、series, map, lists, dict 等类型)。index:索引值,或者可以称为行标签。columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。dtype:数据类型。copy:拷贝数据,默认为 False。'''

三、对象创建方式:

使用列表创建DataFram:

import pandas as pddata = [['Google',10],['Runoob',12],['Wiki',13]]df = pd.DataFrame(data,columns=['Site','Age'],dtype=float)print(df)

通过官场以上代码我们可以发现:

1、二维数组最内层是一行的数据

2、列名在使用DataFrame()函数时,通过columns参数进行了指定,参数形式为列表。其中dtype还指定了float类型。

运行结果如下:

在创建时并没有指定index,所以索引是从0开始的。

使用ndarrys创建DataFram:

import pandas as pddata = {'Site':['Google', 'Runoob', 'Wiki'], 'Age':[10, 12, 13]}df = pd.DataFrame(data)print (df)

这里ndarrys是numpy里的,暂理解为多维数组。

这里的多维数组为字典的value是一个列表。

从代码来看,这种多维数组是DataFrame()函数的标准入参之一,此时多维数组,或者说字典的keys,就是列名,每个子序列对应一个列的数据。

运行如下:

以下为一个多个字典构成的列表数据生成DataFrame的案例:

这里的字典是作为列表的一个元素

import pandas as pddata = [{'a': 1, 'b': 2},{'a': 5, 'b': 10, 'c': 20}]df = pd.DataFrame(data)print (df)

从上述可知,这种结构数据在生成DataFrame时,列表内部字典的keys会成为表格的列,多个字典代表多行数据。

运行如下:

   a   b     c
0  1   2   NaN
1  5  10  20.0

pandas可以使用 loc 属性返回指定行的数据,如果没有设置索引,第一行索引为 0,第二行索引为 1,以此类推:

import pandas as pddata = {"calories": [420, 380, 390],"duration": [50, 40, 45]
}# 数据载入到 DataFrame 对象
df = pd.DataFrame(data)# 返回第一行
print(df.loc[0])
# 返回第二行
print(df.loc[1])

需要注意的是,这里loc[索引]是返回的行数据。

返回指定多行时,可以使用df.loc[0,1],形如此类。

DataFrame生成时也可以指定索引值,以下是个小案例:

import pandas as pddata = {"calories": [420, 380, 390],"duration": [50, 40, 45]
}df = pd.DataFrame(data, index = ["day1", "day2", "day3"])print(df)

对这种指定了索引的DataFrame我们依然可以使用loc[索引名]来获取其值。

如下:

import pandas as pddata = {"calories": [420, 380, 390],"duration": [50, 40, 45]
}df = pd.DataFrame(data, index = ["day1", "day2", "day3"])# 指定索引
print(df.loc["day2"])
运行如下:
calories    380
duration     40
Name: day2, dtype: int64

http://www.yidumall.com/news/102665.html

相关文章:

  • 羽毛球赛事直播appseo排名平台
  • 广州免费律师咨询搜索引擎推广seo
  • 品牌设计网站公司站长之家工具查询
  • 盘锦做网站公司国内做网站的公司
  • 在什么网站做外贸游戏优化
  • 唯美网站模板百度引擎提交入口
  • 音乐网站界面余姚seo智能优化
  • wordpress多站点子网站css错误今日头条新闻推荐
  • 推广网站建设产品介绍郑州seo排名第一
  • 网站建设用图片互联网营销的特点
  • 珠宝类网站建设奶茶推广软文200字
  • 做网站在阿里云上面买哪个服务站长查询工具
  • 济南做网站建设的公司超级推荐的关键词怎么优化
  • asp net网站开发语言的特点百度推广产品有哪些
  • 聊城专业网站设计公司sem竞价推广代运营
  • 服饰商城网站建设怎么查找关键词排名
  • 宿迁做网站优化加速
  • 泉州百度网站快速优化南昌seo快速排名
  • 自助手机建站2022最新新闻
  • 有免费做门户网站吗河北seo关键词排名优化
  • 定制类做网站多少钱网络营销软件哪个好用
  • 旅游门户网站建设方案福建seo排名
  • win2008iis配置网站网站搜索排优化怎么做
  • 淘宝网页版登陆深圳seo排名哪家好
  • 独立网站建设流程上海seo网站策划
  • 如何备份wordpress主题合肥seo排名优化公司
  • 事业单位 网站备案推广任务发布平台app
  • 做reference的网站win10优化大师官网
  • 网站风格分类3步打造seo推广方案
  • vi公司设计包括哪些河源市seo点击排名软件价格