很多人觉得数据分析入门很难,但随着b站和公众号上的学习资源越来越多,学习数据分析已经变得非常简单。以下面为例,从一张规则的表格中,根据门水平名称,生成对物种门水平的表格文件。
in [1]:
import pandas as pd
读取文本文件pd.read_table,读取excel文件,
可以用df = pd.read_excel('*.xlsx',sheet_name='*')。
in [2]:
df = pd.read_table('subsample_otu.tax.0.03.xls')
如下图所示,门水平有12个门的数据。
in [3]:
df['phylum'].unique()out[3]:
array(['acidobacteria', 'actinobacteria', 'armatimonadetes', 'bacteroidetes', 'chloroflexi', 'firmicutes', 'fusobacteria', 'gemmatimonadetes', 'planctomycetes', 'proteobacteria', 'spirochaetes', 'synergistetes'], dtype=object)
in [4]:
for i in df['phylum'].unique(): df[df['phylum']==i].to_excel(i ".xls",index=false)out[4]:
往期相关链接:
1、r基础篇
;
;
;
2、r进阶
;
;
;
;
;
;
;
;
3、数据提交
;
;
;
;
4、表达谱分析
;;
;
5、医学数据分析
;;
;
;
天昊客户服务中心
手机/微信号:18964693703
【本群将为大家提供】
分享生信分析方案
提供数据素材及分析软件支持
定期开展生信分析线上讲座
qq号:1040471849
作者:大熊
审核:有才
来源:天昊生信团