博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python 保存数据的方法(4种方法)
阅读量:6819 次
发布时间:2019-06-26

本文共 2465 字,大约阅读时间需要 8 分钟。

Python 保存数据的方法:

  • open函数保存

使用with open()新建对象

写入数据(这里使用的是爬取豆瓣读书中一本书的豆瓣短评作为例子)

import requestsfrom lxml import etree#发送Request请求url = 'https://book.douban.com/subject/1054917/comments/'head = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.94 Safari/537.36'}#解析HTMLr = requests.get(url, headers=head)s = etree.HTML(r.text)comments = s.xpath('//div[@class="comment"]/p/text()')#print(str(comments))#在写代码的时候可以将读取的内容打印一下#保存数据open函数with open('D:/PythonWorkSpace/TestData/pinglun.txt','w',encoding='utf-8') as f:#使用with open()新建对象f    for i in comments:        print(i)        f.write(i+'\n')#写入数据,文件保存在上面指定的目录,加\n为了换行更方便阅读

  这里指的注意的是: open函数的打开模式

参数 用法
r read只读。若不存在文件会报错。
w write只写。若不存在文件会自动新建。
a apend附加到文件末尾。
rb, wb, ab 操作二进制
r+ 读写模式打开
  • pandas包保存

说道Pandas不得不说一下与之相关的两个数据分析工具包(注意:pandas 、numpy和matplotlib都需要事先安装,详细安装可见之前的博文关于pip方式安装包

  • (Numerical Python的简称),是高性能科学计算和数据分析的基础包
  • pandas:基于Numpy创建的Python包,含有使数据分析工作变得更加简单的高级数据结构和操作工具
  • matplotlib:是一个用于创建出版质量图表的绘图包(主要是2D方面)
    import pandas as pd #导入pandasimport numpy as np #导入numpyimport matplotlib.pypolt as plt #导入matplotlib  

接下来就演示pandas保存数据到CSV和Excel

#导入包 import pandas as pdimport numpy as npdf = pd.DataFrame(np.random.randn(10,4))#创建随机值#print(df.head(2))#查看数据框的头部数据,默认不写为前5行,小于5行时全部显示;也可以自定义查看几行print(df.tail())##查看数据框的尾部数据,默认不写为倒数5行,小于5行时全部显示;也可以自定义查看倒数几行df.to_csv('D:/PythonWorkSpace/TestData/PandasNumpy.csv')#存储到CSV中#df.to_excel('D:/PythonWorkSpace/TestData/PandasNumpy.xlsx')#存储到Excel中(需要提前导入库 pip install openpyxl)
实例中保存豆瓣读书的短评代码如下:
import requestsfrom lxml import etree#发送Request请求url = 'https://book.douban.com/subject/1054917/comments/'head = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.94 Safari/537.36'}#解析HTMLr = requests.get(url, headers=head)s = etree.HTML(r.text)comments = s.xpath('//div[@class="comment"]/p/text()')#print(str(comments))#在写代码的时候可以将读取的内容打印一下'''#保存数据open函数with open('D:/PythonWorkSpace/TestData/pinglun.txt','w',encoding='utf-8') as f:#使用with open()新建对象f    for i in comments:        print(i)        f.write(i+'\n')#写入数据,文件保存在上面指定的目录,加\n为了换行更方便阅读'''#保存数据pandas函数   到CSV 和Excelimport pandas as pddf = pd.DataFrame(comments)#print(df.head())#head()默认为前5行df.to_csv('D:/PythonWorkSpace/TestData/PandasNumpyCSV.csv')#df.to_excel('D:/PythonWorkSpace/TestData/PandasNumpyEx.xlsx')

  

 

  • csv模块保存

待续....

 

  • numpy包保存

待续...

转载于:https://www.cnblogs.com/PeterZhang1520389703/p/8205965.html

你可能感兴趣的文章
Hyper-V快速导入虚拟机的两个注意事项
查看>>
【转】getopt模块,实现获取命令行参数
查看>>
安装JDK和配置环境变量
查看>>
C# 正则表达式大全
查看>>
pytorch梯度裁剪(Clipping Gradient):torch.nn.utils.clip_grad_norm
查看>>
【VUE】@click加上v-bind绑定切换类名及动画事件
查看>>
Microsoft发布新一代主机:Xbox One
查看>>
运维经验分享:关于系统运维监控的几点建议
查看>>
jQuery渐隐渐现字体发虚的问题
查看>>
[SDOI2008]烧水问题
查看>>
杂项之rabbitmq
查看>>
【转】关于大型网站技术演进的思考(十)--网站静态化处理—动静整合方案(2)...
查看>>
jQuery练习题HTML文件
查看>>
SQL注入原理
查看>>
MySQL 锁(lock与latch)
查看>>
python
查看>>
DataTable数据存入指定路径的Excel文件
查看>>
Linq-C#左连接
查看>>
c和指针读书笔记
查看>>
常用正则表达式集锦
查看>>