上篇中,末尾我们生成文件phylum_1.xlsx,phylum列有单元格是合并状态,在pandas重新读取后会出现nan,因此需要对nan数据进行填充后分析。本次介绍几种填充方法。
in [1]:
import pandas as pdin [2]:
df = pd.read_excel('data/asv/phylum_1.xlsx') df
out[2]:
2.1用数值或字符串填充
in [3]:
nan处均填充数值666
df.fillna(666)out[3]:
in [4]:
nan处均填充uncultured
df.fillna('uncultured')out[4]:
2.2用字典填充
in [5]:
字典格式{key1:value1,key2:value2,......}
df.fillna({'phylum':666})
out[5]:
2.3method参数填充
2.3.1用前面的值填充
in [6]:
df.fillna(method='ffill')out[6]:
2.3.2用后面的值填充
in [7]:
df.fillna(method='bfill')out[7]:
2.3.2用后面的值填充
in [7]:
df.fillna(method='bfill')out[7]:
2.3.3limit限制填充的个数
in [8]:
df.fillna(method='ffill',limit=2)out[8]:
2.3.4axis=1 修改填充方向
默认参数数axis=0,按列填充。axis=1则按照行填充。bfill按照后面的值填充
in [9]:
df.fillna(method='bfill',axis=1)out[9]:
inplace=true直接修改原对象
inplace参数默认为false,填充后不改变原数据。inplace=true则将原数据直接改变。
df.fillna(method='ffill',inplace=true) dfout[10]:
往期相关链接:
1、r基础篇
;
;
;
;
2、r进阶
;
;
;
;
;
;
;
;
;
3.python基础篇
;4、数据提交
;
;
;
;
5、表达谱分析
;;
;
6、医学数据分析
;;
;
;
天昊客户服务中心
手机/微信号:18964693703
【本群将为大家提供】
分享生信分析方案
提供数据素材及分析软件支持
定期开展生信分析线上讲座
qq号:1040471849
作者:大熊
审核:有才
来源:天昊生信团