??解決方法:python的版本問題!換成python3就自動(dòng)解決了!當(dāng)然也有其他的方法,這里就不再深究
需求情況:有的時(shí)候,數(shù)據(jù)很多,但是只要僅僅對(duì)部分列的數(shù)據(jù)進(jìn)行分析的話,要怎么做?
解決方法:
df =pandas.read_excel('1.xls',sheetname= '店鋪分析日?qǐng)?bào)')
?df =df.loc[:,['關(guān)鍵詞','帶來的訪客數(shù)','跳失率']] #訪問指定的列
一行讀取數(shù)據(jù),第二行訪問指定列
需求情況:有一個(gè)表格,里面的列是單價(jià),數(shù)量,想再輸出一個(gè)總價(jià)的列,或是對(duì)一些數(shù)據(jù)進(jìn)行總結(jié)
解決方法:直接上代碼
from pandas importread_csv;
import pandas;
df = read_csv("1.csv",sep="|");
#把計(jì)算結(jié)果添加為一個(gè)新的列
df['result'] =df.price*df.num
print (df)
需求情況:比較蛋疼的一個(gè)情況,電商很多數(shù)據(jù)都是百分比的,帶有百分號(hào),不能進(jìn)行直接的計(jì)算,需要對(duì)其進(jìn)行轉(zhuǎn)換,然后再輸出
解決方法:
from pandas importread_csv;
import pandas;
df = read_csv("1.csv",sep="|");
f =df['跳失率'].str.strip("%").astype(float)/100;
f.round(decimals=2)
f_str = f.apply(lambda x:format(x, '.2%'));
df['跳失率']?=
需求情況:有的時(shí)候需要寫一個(gè)通用腳本,比如隨機(jī)抽樣分析,程序自動(dòng)獲取行和列的話,寫出來的腳本通用性明顯會(huì)很強(qiáng)
解決方法:
df.columns.size
df.iloc[:, 0].size
需求情況:這個(gè)就不用說了,到處都要用到?
解決方法:
df['跳失率'].size
newDF = df.sort(['曝光量','帶來的訪客數(shù)'], ascending=[True, False]);
需求情況:同樣,十幾列的數(shù)據(jù),如果你想獲取指定的輸出數(shù)據(jù),可以用方法2,但是如果想要獲取的數(shù)據(jù)列比較多,只有1-2行不想要,這樣就可以用指定刪除列的方法了
解決方法:
df.columns.delete(1)?
一行代碼搞定!?
總結(jié):整體來說的,python的語法在做數(shù)據(jù)分析還是相當(dāng)簡單的,很多的需求基本上就是一行代碼搞定!
df.append([1,2,34,,5])
聯(lián)系客服