Linux文本處理命令

Sort命令

sort命令的功能是對檔案中的各行進行排序。sort命令有許多非常實用的選項，這些選項最初是用來對資料庫格式的檔案內容進行各種排序操作的。實際上，sort命令可以被認為是一個非常強大的數據管理工具，用來管理內容類似資料庫記錄的檔案。

Sort命令將逐行對檔案中的內容進行排序，如果兩行的首字元相同，該命令將繼續比較這兩行的下一字元，如果還相同，將繼續進行比較。

語法：

sort [選項] 檔案

說明：sort命令對指定檔案中所有的行進行排序，並將結果顯示在標準輸出上。如不指定輸入檔案或使用“- ”，則表示排序內容來自標準輸入。

sort排序是根據從輸入行抽取的一個或多個關鍵字進行比較來完成的。排序關鍵字定義了用來排序的最小的字元序列。預設情況下以整行為關鍵字按ASCII字元順序進行排序。

改變預設設定的選項主要有：

- m 若給定檔案已排好序，合併檔案。

- c 檢查給定檔案是否已排好序，如果它們沒有都排好序，則列印一個出錯信息，並以狀態值1退出。

- u 對排序後認為相同的行只留其中一行。

- o 輸出檔案將排序輸出寫到輸出檔案中而不是標準輸出，如果輸出檔案是輸入檔案之一，sort先將該檔案的內容寫入一個臨時檔案，然後再排序和寫輸出結果。

改變預設排序規則的選項主要有：

- d 按字典順序排序，比較時僅字母、數字、空格和制表符有意義。

- f 將小寫字母與大寫字母同等對待。

- I 忽略非列印字元。

- M 作為月份比較：“JAN”<“FEB” p>

- r 按逆序輸出排序結果。

+posl - pos2 指定一個或幾個欄位作為排序關鍵字，欄位位置從posl開始，到pos2為止（包括posl，不包括pos2）。如不指定pos2，則關鍵字為從posl到行尾。欄位和字元的位置從0開始。

- b 在每行中尋找排序關鍵字時忽略前導的空白（空格和制表符）。

- t separator 指定字元separator作為欄位分隔設定。

下面通過幾個例子來講述sort的使用。

用sort命令對text檔案中各行排序後輸出其結果。請注意，在原檔案的第二、三行上的第一個單詞完全相同，該命令將從它們的第二個單詞vegetables與fruit的首字元處繼續進行比較。

$ cat text

vegetable soup

fresh vegetables

fresh fruit

lowfat milk

$ sort text

fresh fruit

fresh vegetables

lowfat milk

vegetable soup

用戶可以保存排序後的檔案內容，或把排序後的檔案內容輸出至印表機。下例中用戶把排序後的檔案內容保存到名為result的檔案中。