◆吳濤/丹江口市審計(jì)局
筆者在工作中經(jīng)常會(huì)碰到如企業(yè)股東信息、不動(dòng)產(chǎn)登記信息等,將同一公司或不動(dòng)產(chǎn)的所有權(quán)利人的姓名、身份證號(hào)信息集中保存在一個(gè)單元格中(如圖1所示),不便于后期的數(shù)據(jù)分析。無論用常規(guī)的哪種方法來進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化,往往難度較大且費(fèi)時(shí)費(fèi)力。這里以企業(yè)股東信息為例,介紹運(yùn)用Excel 2016中的Power Query三分鐘完成數(shù)據(jù)的整理。
圖1
Power Query是Excel 2016及Power BI Desktop中內(nèi)置的一個(gè)免費(fèi)工具,主要用于數(shù)據(jù)獲取、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)處理,入手極快,不需要太多的學(xué)習(xí)時(shí)間,僅使用Power Query圖形界面就足以完成80%的日常任務(wù)。
1.如圖2所示,將光標(biāo)定位到表格中,然后選擇“數(shù)據(jù)—從表格”,將表格引入Power Query中。
圖2
2.如圖3所示,選中“姓名(股東)、證件號(hào)碼(股東)”兩列,選擇“逆透視列”,將二維表轉(zhuǎn)為一維表。
圖3
3.如圖4所示,選中“值”列,選擇“拆分列—按分隔符”,將每個(gè)人的姓名、身份證號(hào)拆分出來。其中:分隔符為“逗號(hào)”,拆分為“行”。
圖4
4.由于每條記錄除“值”不同外,存在重復(fù),在進(jìn)行升維操作時(shí)會(huì)造成取值混亂。為了唯一區(qū)分每條記錄,需要給姓名和身份證號(hào)分別進(jìn)行編號(hào)加以區(qū)分。如圖5所示,選擇“證件號(hào)碼(法定代表人)”“屬性”執(zhí)行“轉(zhuǎn)換—分組依據(jù)”,對(duì)“所有行”進(jìn)行計(jì)數(shù)分組。
圖5
5.添加自定義列,錄入公式=Table.AddIndexColumn([計(jì)數(shù)],"分組編號(hào)",1),作用是對(duì)每個(gè)子表添加從1開始的索引編號(hào),并將該列命名為“分組編號(hào)”。刪除“計(jì)數(shù)”列,然后展開“自定義”列,完成分類索引編號(hào),如圖6所示。
圖6
6.選中“屬性”列,執(zhí)行“轉(zhuǎn)換—任意列—透視列”,即可得到所需標(biāo)準(zhǔn)表,如圖7所示?!?/p>
圖7