python从excel中找到数据

2024-05-19

1. python从excel中找到数据

一、安装xlrd库
　　可以下载xlrd库包到本地安装，也可以通过pip命令安装，这里我选择pip命令：
　　pip install xlrd
二、使用xlrd读取excel数据
　　具体详细的操作可以参考xlrd库操作说明文档，以下是两种读取excel数据的方法：
　　1、根据Excel中sheet名称读取数据：　　　　

1 def readExcelDataByName(fileName, sheetName): 2     table = None 3     errorMsg = None 4     try: 5         data = xlrd.open_workbook(fileName) 6         table = data.sheet_by_name(sheetName) 7     except Exception, msg: 8         errorMsg = msg9     return table, errorMsg

　　2、根据Excel中sheet的序号获取：

1 def readExcelDataByIndex(fileName, sheetIndex):2     table = None3     errorMsg = ""4     try:5         data = xlrd.open_workbook(fileName)6         table = data.sheet_by_index(sheetIndex)7     except Exception, msg:8         errorMsg = msg9     return table, errorMsg

　　3、根据列名获取相应序号，由于有时读取excel中列数据时，需要通过列头名称获取相应的列中的值，所以写了下面这个返回列名所在表格中的index。然后就可以直接通过table.cell_value(i, getColumnIndex(table,'列名'))获取列的值。

1 def getColumnIndex(table, columnName): 2     columnIndex = None 3      3     for i in range(table.ncols): 5         4         if(table.cell_value(0, i) == columnName): 5             columnIndex = i 6             break7     return columnIndex

　　下面加入需要读取如下excel表格中的数据,在读取数据时直接根据列名去获取相应的值。

根据列名读取相应的值，代码如下：

1 #!/usr/bin/python 2 # coding=utf-8 3 __author__ = 'Paul' 4 import xlrd 5 import chardet 6 import traceback 7 def getColumnIndex(table, columnName): 8     columnIndex = None 9     #print table10     for i in range(table.ncols):11         #print columnName12         #print table.cell_value(0, i)13         if(table.cell_value(0, i) == columnName):14             columnIndex = i15             break16     return columnIndex17 def readExcelDataByName(fileName, sheetName):18     #print fileName19     table = None20     errorMsg = ""21     try:22         data = xlrd.open_workbook(fileName)23         table = data.sheet_by_name(sheetName)24     except Exception, msg:25         errorMsg = msg26     return table, errorMsg27 def readExcelDataByIndex(fileName, sheetIndex):28     table = None29     errorMsg = ""30     try:31         data = xlrd.open_workbook(fileName)32         table = data.sheet_by_index(sheetIndex)33     except Exception, msg:34         errorMsg = msg35     return table, errorMsg36 if __name__ == '__main__':37     #example38     xlsfile= 'F:/test_AutoTesting/TestCase/RunList.xlsx'39     table = readExcelDataByName(xlsfile, 'Sheet1')[0]40     #获取第一行的值    41     testcase_id = table.cell_value(1, getColumnIndex(table,'TestCaseID'))42     app_config = table.cell_value(1, getColumnIndex(table,'APPConfig'))43 44     print u'测试用例ID为：%s'%(testcase_id)45     print u'配置信息为：%s'%(app_config)

得出结果如下：

　　4、读取excel中的文本或数值转换成了float的问题
　　 　有时Excel中的值为20，但读取出来的值却变成了20.0，这与我们想要的不大一致，特别是做UI自动化测试过程中需要下拉选择值时就完全选不出想要的选项了。目前我想到的是通过下面的语句来处理：
if isinstance(inputValue,float):    #判断读取到的值是否为floatif inputValue==int(inputValue): #判断读取到的值与转成int后的值是否相等，如果相等则转成intinputValue = int(inputValue)inputValue = str(inputValue) #转成str

python从excel中找到数据

2. python如何对excel数据进行处理

在python语言中，可以使用xlrd和xlwt两个库操作excel。
在python语言中处理Excel的方法：
在python项目中，新建python文件，并依次导入xlrd和xlwt。
接着调用open_workbook()方法，打开一个excel文件
调用sheet_by_name()方法，读取文件的sheet页
如果是后面加了个s，sheet_names表示获取excel中所有的sheet页
利用sheets()方法加序号，可以获取某个sheet页对象
如果想要获取excel某个sheet页中记录的总数，使用nrows
在cell()中传入两个值，一个行一个列，然后value获取对应单元格的值
推荐：python视频教程以上就是小编分享的关于python如何对excel数据进行处理的详细内容希望对大家有所帮助，更多有关python教程请关注环球青藤其它相关文章！

3. 分析excel和python在处理数据时各自的优劣点？

两者都是数据分析处理工具，excel上手简单，操作界面人性化，小批量数据处理神器；
python需要点编程基础，安装步骤、导入库、编译器、语法让很多人不懂了，但它在扩展性强，存在大量外部扩展库，什么批量合并excel工作簿、批量发送邮件、自动化生成报表之类，虽然这些excel都可以，但涉及到VB语言，远不及python语法简单；但是如果一份几百条数据，需要统计一个结果，excel插入透视表，分类汇总两步搞定，你非要用python，先是导入pandas/numpy,又是xlrd，接着又是groupby，一顿操作猛如虎，看着十分高大上，人家excel2秒钟早已搞定；
数据处理：两者都很熟练的情况下，不考虑数据数量，基本平分秋色，excel成熟体系的快捷键、功能；python丰富的各类外部库；
数据分析：这个的话excel虽然有规划求解、方差分析、T检验之类的工具，但是你要搞个k-mean聚类、决策树之类的，excel是不行的，还有就是处理数据级与运行效率的问题，excel单表100W，能处理得差不多就二三十万，多了就卡死了，python就不存在这个问题。
总而言之，公司日常报表，财务类、考勤类、部门小组业绩类，这些基本excel就可以搞定，但你要搞大数据分析，随随便便几百万条数据，excel表示心有余而力不足。

分析excel和python在处理数据时各自的优劣点？

4. 用python操作excel数据之避坑秘技

用python操作excel表里的数据非常方便，可以把不同报表，不同类型的数据各种乾坤大挪移，汇集到一起进行展示。但初学者可能会遇到一些大坑，百思不得其解，而不得不放弃这个神器。现把我在自学过程中遇到的一些坑与大家分享，给初学者参考，欢迎批评指正！
  
 坑一：用pandas的to_excel写入EXCEL时，会把原数据清空。
  
 解决方案：先用openpyxl的load_workbook打开工作薄，再用pandas的ExcelWriter新建写入器，把之前打开的工作薄赋值给写入器的工作薄。
  
 坑二：把带有公式的sheet1数据导入再写入sheet2时，会发现带公式的数据全部为空。
  
 解决方案：可用win32com.client中的Dispatch把EXCEL表打开再保存。
  
 坑三：当把复制文件，新建文件，打开保存文件，数据写入都写在一个程序时，往往由于EXCEL打开保存时间较长而与后续程序冲突报错。
  
 解决方案：每个环节建模块顺序执行，各环节间用time.sleep隔开。

5. 怎么用python读取excel表格的数据

一、读excel表
读excel要用到xlrd模块，官网安装（http://pypi.python.org/pypi/xlrd）。然后就可以跟着里面的例子稍微试一下就知道怎么用了。大概的流程是这样的：
1、导入模块

复制代码代码如下:
import xlrd
2、打开Excel文件读取数据

复制代码代码如下:
data = xlrd.open_workbook('excel.xls')
3、获取一个工作表
①  table = data.sheets()[0]       #通过索引顺序获取
②  table = data.sheet_by_index(0) #通过索引顺序获取
③  table = data.sheet_by_name(u'Sheet1')#通过名称获取
4、获取整行和整列的值（返回数组）

复制代码代码如下:
table.row_values(i)
table.col_values(i)

5、获取行数和列数　

复制代码代码如下:
table.nrows
table.ncols

6、获取单元格

复制代码代码如下:
table.cell(0,0).value
table.cell(2,3).value

就我自己使用的时候觉得还是获取cell最有用，这就相当于是给了你一个二维数组，余下你就可以想怎么干就怎么干了。得益于这个十分好用的库代码很是简洁。但是还是有若干坑的存在导致话了一定时间探索。现在列出来供后人参考吧：
1、首先就是我的统计是根据姓名统计各个表中的信息的，但是调试发现不同的表中各个名字貌似不能够匹配，开始怀疑过编码问题，不过后来发现是因为　　空格。因为在excel中输入的时候很可能会顺手在一些名字后面加上几个空格或是tab键，这样看起来没什么差别，但是程序处理的时候这就是两个完全　　不同的串了。我的解决方法是给每个获取的字符串都加上strip（）处理一下。效果良好
2、还是字符串的匹配，在判断某个单元格中的字符串（中文）是否等于我所给出的的时候发现无法匹配，并且各种unicode也不太奏效，百度过一些解决　　方案，但是都比较复杂或是没用。最后我采用了一个比较变通的方式：直接从excel中获取我想要的值再进行比较，效果是不错就是通用行不太好，个　　呢不能问题还没解决。
二、写excel表
写excel表要用到xlwt模块，官网下载（http://pypi.python.org/pypi/xlwt）。大致使用流程如下：
1、导入模块

复制代码代码如下:
import xlwt

2、创建workbook（其实就是excel，后来保存一下就行）

复制代码代码如下:
workbook = xlwt.Workbook(encoding = 'ascii')

3、创建表

复制代码代码如下:
worksheet = workbook.add_sheet('My Worksheet')

4、往单元格内写入内容

复制代码代码如下:
worksheet.write(0, 0, label = 'Row 0, Column 0 Value')

5、保存

复制代码代码如下:
workbook.save('Excel_Workbook.xls')

由于我的需求比较简单，所以这上面没遇到什么问题，唯一的就是建议还是用ascii编码，不然可能会有一些诡异的现象。
当然xlwt功能远远不止这些，他甚至可以设置各种样式之类的。附上一点例子

复制代码代码如下:

Examples Generating Excel Documents Using Python's xlwt
Here are some simple examples using Python's xlwt library to dynamically generate Excel documents.
Please note a useful alternative may be ezodf, which allows you to generate ODS (Open Document Spreadsheet) files for LibreOffice / OpenOffice. You can check them out at:http://packages.python.org/ezodf/index.html
The Simplest Example
import xlwt
workbook = xlwt.Workbook(encoding = 'ascii')
worksheet = workbook.add_sheet('My Worksheet')
worksheet.write(0, 0, label = 'Row 0, Column 0 Value')
workbook.save('Excel_Workbook.xls')
Formatting the Contents of a Cell
import xlwt
workbook = xlwt.Workbook(encoding = 'ascii')
worksheet = workbook.add_sheet('My Worksheet')
font = xlwt.Font() # Create the Font
font.name = 'Times New Roman'
font.bold = True
font.underline = True
font.italic = True
style = xlwt.XFStyle() # Create the Style
style.font = font # Apply the Font to the Style
worksheet.write(0, 0, label = 'Unformatted value')
worksheet.write(1, 0, label = 'Formatted value', style) # Apply the Style to the Cell
workbook.save('Excel_Workbook.xls')
Attributes of the Font Object
font.bold = True # May be: True, False
font.italic = True # May be: True, False
font.struck_out = True # May be: True, False
font.underline = xlwt.Font.UNDERLINE_SINGLE # May be: UNDERLINE_NONE, UNDERLINE_SINGLE, UNDERLINE_SINGLE_ACC, UNDERLINE_DOUBLE, UNDERLINE_DOUBLE_ACC
font.escapement = xlwt.Font.ESCAPEMENT_SUPERSCRIPT # May be: ESCAPEMENT_NONE, ESCAPEMENT_SUPERSCRIPT, ESCAPEMENT_SUBSCRIPT
font.family = xlwt.Font.FAMILY_ROMAN # May be: FAMILY_NONE, FAMILY_ROMAN, FAMILY_SWISS, FAMILY_MODERN, FAMILY_SCRIPT, FAMILY_DECORATIVE
font.charset = xlwt.Font.CHARSET_ANSI_LATIN # May be: CHARSET_ANSI_LATIN, CHARSET_SYS_DEFAULT, CHARSET_SYMBOL, CHARSET_APPLE_ROMAN, CHARSET_ANSI_JAP_SHIFT_JIS, CHARSET_ANSI_KOR_HANGUL, CHARSET_ANSI_KOR_JOHAB, CHARSET_ANSI_CHINESE_GBK, CHARSET_ANSI_CHINESE_BIG5, CHARSET_ANSI_GREEK, CHARSET_ANSI_TURKISH, CHARSET_ANSI_VIETNAMESE, CHARSET_ANSI_HEBREW, CHARSET_ANSI_ARABIC, CHARSET_ANSI_BALTIC, CHARSET_ANSI_CYRILLIC, CHARSET_ANSI_THAI, CHARSET_ANSI_LATIN_II, CHARSET_OEM_LATIN_I
font.colour_index = ?
font.get_biff_record = ?
font.height = 0x00C8 # C8 in Hex (in decimal) = 10 points in height.
font.name = ?
font.outline = ?
font.shadow = ?
Setting the Width of a Cell
import xltw
workbook = xlwt.Workbook()
worksheet = workbook.add_sheet('My Sheet')
worksheet.write(0, 0, 'My Cell Contents')
worksheet.col(0).width = 3333 # 3333 = 1" (one inch).
workbook.save('Excel_Workbook.xls')
Entering a Date into a Cell
import xlwt
import datetime
workbook = xlwt.Workbook()
worksheet = workbook.add_sheet('My Sheet')
style = xlwt.XFStyle()
style.num_format_str = 'M/D/YY' # Other options: D-MMM-YY, D-MMM, MMM-YY, h:mm, h:mm:ss, h:mm, h:mm:ss, M/D/YY h:mm, mm:ss, [h]:mm:ss, mm:ss.0
worksheet.write(0, 0, datetime.datetime.now(), style)
workbook.save('Excel_Workbook.xls')
Adding a Formula to a Cell
import xlwt
workbook = xlwt.Workbook()
worksheet = workbook.add_sheet('My Sheet')
worksheet.write(0, 0, 5) # Outputs 5
worksheet.write(0, 1, 2) # Outputs 2
worksheet.write(1, 0, xlwt.Formula('A1*B1')) # Should output "10" (A1[5] * A2[2])
worksheet.write(1, 1, xlwt.Formula('SUM(A1,B1)')) # Should output "7" (A1[5] + A2[2])
workbook.save('Excel_Workbook.xls')
Adding a Hyperlink to a Cell
import xlwt
workbook = xlwt.Workbook()
worksheet = workbook.add_sheet('My Sheet')
worksheet.write(0, 0, xlwt.Formula('HYPERLINK("http://www.google.com";"Google")')) # Outputs the text "Google" linking to http://www.google.com
workbook.save('Excel_Workbook.xls')
Merging Columns and Rows
import xlwt
workbook = xlwt.Workbook()
worksheet = workbook.add_sheet('My Sheet')
worksheet.write_merge(0, 0, 0, 3, 'First Merge') # Merges row 0's columns 0 through 3.
font = xlwt.Font() # Create Font
font.bold = True # Set font to Bold
style = xlwt.XFStyle() # Create Style
style.font = font # Add Bold Font to Style
worksheet.write_merge(1, 2, 0, 3, 'Second Merge', style) # Merges row 1 through 2's columns 0 through 3.
workbook.save('Excel_Workbook.xls')
Setting the Alignment for the Contents of a Cell
import xlwt
workbook = xlwt.Workbook()
worksheet = workbook.add_sheet('My Sheet')
alignment = xlwt.Alignment() # Create Alignment
alignment.horz = xlwt.Alignment.HORZ_CENTER # May be: HORZ_GENERAL, HORZ_LEFT, HORZ_CENTER, HORZ_RIGHT, HORZ_FILLED, HORZ_JUSTIFIED, HORZ_CENTER_ACROSS_SEL, HORZ_DISTRIBUTED
alignment.vert = xlwt.Alignment.VERT_CENTER # May be: VERT_TOP, VERT_CENTER, VERT_BOTTOM, VERT_JUSTIFIED, VERT_DISTRIBUTED
style = xlwt.XFStyle() # Create Style
style.alignment = alignment # Add Alignment to Style
worksheet.write(0, 0, 'Cell Contents', style)
workbook.save('Excel_Workbook.xls')
Adding Borders to a Cell
# Please note: While I was able to find these constants within the source code, on my system (using LibreOffice,) I was only presented with a solid line, varying from thin to thick; no dotted or dashed lines.
import xlwt
workbook = xlwt.Workbook()
worksheet = workbook.add_sheet('My Sheet')
borders = xlwt.Borders() # Create Borders
borders.left = xlwt.Borders.DASHED # May be: NO_LINE, THIN, MEDIUM, DASHED, DOTTED, THICK, DOUBLE, HAIR, MEDIUM_DASHED, THIN_DASH_DOTTED, MEDIUM_DASH_DOTTED, THIN_DASH_DOT_DOTTED, MEDIUM_DASH_DOT_DOTTED, SLANTED_MEDIUM_DASH_DOTTED, or 0x00 through 0x0D.
borders.right = xlwt.Borders.DASHED
borders.top = xlwt.Borders.DASHED
borders.bottom = xlwt.Borders.DASHED
borders.left_colour = 0x40
borders.right_colour = 0x40
borders.top_colour = 0x40
borders.bottom_colour = 0x40
style = xlwt.XFStyle() # Create Style
style.borders = borders # Add Borders to Style
worksheet.write(0, 0, 'Cell Contents', style)
workbook.save('Excel_Workbook.xls')
Setting the Background Color of a Cell
import xlwt
workbook = xlwt.Workbook()
worksheet = workbook.add_sheet('My Sheet')
pattern = xlwt.Pattern() # Create the Pattern
pattern.pattern = xlwt.Pattern.SOLID_PATTERN # May be: NO_PATTERN, SOLID_PATTERN, or 0x00 through 0x12
pattern.pattern_fore_colour = 5 # May be: 8 through 63. 0 = Black, 1 = White, 2 = Red, 3 = Green, 4 = Blue, 5 = Yellow, 6 = Magenta, 7 = Cyan, 16 = Maroon, 17 = Dark Green, 18 = Dark Blue, 19 = Dark Yellow , almost brown), 20 = Dark Magenta, 21 = Teal, 22 = Light Gray, 23 = Dark Gray, the list goes on...
style = xlwt.XFStyle() # Create the Pattern
style.pattern = pattern # Add Pattern to Style
worksheet.write(0, 0, 'Cell Contents', style)
workbook.save('Excel_Workbook.xls')
TODO: Things Left to Document
- Panes -- separate views which are always in view
- Border Colors (documented above, but not taking effect as it should)
- Border Widths (document above, but not working as expected)
- Protection
- Row Styles
- Zoom / Manification
- WS Props?
Source Code for reference available at: https://secure.simplistix.co.uk/svn/xlwt/trunk/xlwt/

怎么用python读取excel表格的数据

6. python处理excel的优势

1、Python可以处理比Excel更大的数据集；可以更容易地实现自动化分析；建立复杂的机器学习模型是很容易的。

2、与SPSS相比，SPSS是一种统计软件，只适用于科学研究领域的实验数据分析，不适合偏向于实际应用场景的数据分析；另一方面，Python可以处理复杂的数据逻辑，适合这些场景；

3、与R语言相比，Python只有一个机器学习库——Sklearn，所有的机器学习方法都集中在这个库中。但是，我们不知道R语言中有多少库用于机器学习。R语言中的机器学习方法非常分散，很难掌握。




此外，Python用户的数量正在上升，一些过去只使用R的人转向Python，对一项正在上升的技术进行投资，因此未来将更加广阔。



4、与以上工具相比，Python在机器学习、网络爬虫和大数据分析方面更加得手。

因为Python有丰富的第三方库，所以Python在数据分析方面可以处理问题很广，从Excel更好的公式来计算，MATLAB善于科学计算，然后对这些分散R语言机器学习库可以做事情，Python可以优雅平静的脸。
但是，这些工具并不擅长的web爬虫、大数据分析（结合Spark）和Python可以很好地完成。

7. 在数据分析方面，比起python，excel的局限性在哪

差别如下：
1、Python是一门编程语言，有很多用它写出来的工具，也有直接对excel操作的Python工具包。
2、excel只是个表格处理工具，虽然里面也可以编程。
3、简单来说excel能做到的Python都能做到，但是excel不能很强大的编程，不能进行丰富逻辑处理，复杂的运算分析

在数据分析方面，比起python，excel的局限性在哪

8. python处理excel的优势有什么？

① 相比Excel，Python能够处理更大的数据集;能够更容易的实现自动化分析;能够比较容易的建立复杂的机器学习模型;

② 相比spss，spss是个统计软件，只适合在科学研究领域做实验数据的分析，并不适合做偏向实际应用场景的数据的分析;而Python能够处理复杂的数据逻辑，适合这些场景;

③ 相比R语言，Python的机器学习库只有一个—sklearn，所有的机器学习方法都集中在这一个库中，而R语言，我们并不清楚它到底有多少个用来做机器学习的库，R语言中的机器学习方法是如此的分散，以至于很难掌握。而且Python的使用人数在不断上升，有一些曾经只使用R的人在转向Python，投入到一个呈现上升趋势的技术中，未来才会更加宽广。



④ 相比上述的几个工具，Python在做机器学习，网络爬虫，大数据分析时更加的得心应手。

因为Python拥有像海一样丰富的第三方库，所以Python在数据分析方面能够处理的问题非常之广，从Excel比较擅长的公式计算，数据透视分析，到MATLAB比较擅长的科学计算，再到R语言中那些零散的机器学习库所能做的事情，Python都能优雅从容的面对。而这些工具不擅长的网络爬虫，大数据分析(结合spark)，Python更是能够出色的完成。