俞木發(fā)
方法1:QQ的OCR識圖法通過查看原始數(shù)據(jù)可以知道,每個人的手機號位數(shù)都是11位,可以先在Excel中調(diào)整列寬,使得列寬正好可以顯示11位數(shù)字,這樣人名和電話號碼就自動分列顯示了。接著啟動QQ并打開截圖組件,對單元格進行截圖,點擊截圖工具欄的“文”(即屏幕識圖工具)進行OCR識別,在右側(cè)的識別結(jié)果中,可以看到名字和電話已經(jīng)實現(xiàn)了自動分離(圖2)。
點擊QQ識別窗口右側(cè)窗格下的“轉(zhuǎn)為在線文檔”按鈕,按提示登錄騰訊文檔后,上述識別的數(shù)據(jù)就會自動在“騰訊文檔”中打開?,F(xiàn)在將識別后的數(shù)據(jù)和原始數(shù)據(jù)進行核對,對識別錯誤的數(shù)據(jù)進行訂正后,雙擊A1單元格,全選內(nèi)容并復(fù)制(圖3)。
返回到Excel 2019窗口并新建工作表,然后將A列的數(shù)據(jù)格式設(shè)置為“文本”,這樣將上述復(fù)制的內(nèi)容粘貼到工作表后,就完成了數(shù)據(jù)的分離(圖4)。
我們還可以利用Word 2019的查找替換法來提取數(shù)據(jù)。通過觀察原始數(shù)據(jù)可以知道,數(shù)據(jù)類型主要是漢字和數(shù)字兩大類,因此我們只要在Word中依次對這兩類數(shù)據(jù)進行替換即可。
首先將數(shù)據(jù)復(fù)制到新建的Word文檔中,接著依次點擊“開始→ 替換”,在“查找內(nèi)容”處輸入“[一-龥]”(不含雙引號,下同,即查找所有的漢字),在“替換為”處輸入“^p”(即段落標記,可以依次點擊下方的“ 特殊格式→ 段落標記”輸入),展開“更多”并勾選其下的“使用通配符”,最后點擊“全部替換”,這樣即可將漢字全部刪除,僅保留電話號碼(圖5)。
完成替換后按下“Ctrl+A”組合鍵全選數(shù)據(jù)并復(fù)制,接著返回E xc e l并新建工作表,選中B列,將其格式設(shè)置為“文本”,再定位到B1單元格并依次點擊“開始→ 粘貼→匹配目標格式”。然后選中B列數(shù)據(jù),按下F5鍵打開并選擇“定位條件→空值”,最后將選中的空單元格全部刪除,這樣就可以完成電話號碼的提取了(圖6)。
姓名的提取則需在圖5所示窗口的“查找內(nèi)容”處輸入“[0-9]”(表示查找數(shù)字),其他同上,完成替換后粘貼到圖6所示的A列并刪除空單元格,這樣在A、B列就可以分離出名字和電話數(shù)據(jù)了。如果還要轉(zhuǎn)換為圖4所示的格式,那么只要將電話號碼復(fù)制到名字的后方,接著在C1:C11區(qū)域輸入01-11,在C12:C22也輸入同樣的數(shù)字,最后以C列為基準排序即可(圖7)。
如果原始數(shù)據(jù)的格式和字符數(shù)是一致的,比如從某競品網(wǎng)站復(fù)制到的信息是類似“商品01訂單號139123456789商品02訂單號139123456781”的數(shù)據(jù),即商品代碼+數(shù)字,均為7+12=19位字符,現(xiàn)在需要在Excel中將商品名稱和訂單號分離,首先將數(shù)據(jù)復(fù)制到A1單元格中,定位到B1單元格并輸入1,在B2單元格中輸入公式“=B1+7”,B3單元格中輸入公式“=B2+12”,接著選中B2:B3區(qū)域并下拉填充公式(圖8)。
繼續(xù)定位到C1單元格并輸入公式“=MID($A$1,B1,7)”,表示以B1中的數(shù)字為基準,從第1個字符開始,依次從左到右提取A1數(shù)據(jù)中的7個字符(即提取“商品01訂單號”這樣形式的7個字符),繼續(xù)在C2單元格中輸入公式“=MID($A$1,B2,12)”,表示從第8個字符開始,依次提取12個字符(即提取訂單號數(shù)據(jù)),選中C1:C2區(qū)域并下拉填充公式,這樣就完成數(shù)據(jù)整理的要求了(圖9)。