錕斤拷

錕斤拷

錕斤拷,是一串經常在搜尋引擎頁面和其他網站上看到的亂碼字元。亂碼源於GBK字元集和Unicode字元集之間的轉換問題。

基本介紹

  • 中文名:錕斤拷
  • 屬性:亂碼字元
  • 原因:字元集之間的轉換錯誤
  • 出現領域:網際網路
示例,原因,出現,

示例

“錕屆瀿錕斤拷雮傡錕斤拷直錕斤拷錕”、“錕斤拷錕斤拷之錕斤拷錕窖э拷錕 ”……
上面這些字句是毫無實際意義的,但它們卻形象地表達出了一些莫名其妙的問題。這是一個很經典的亂碼,最容易出現的地方就是搜尋引擎。
例如這個招聘就非常經典:
單位性質:外商獨資企業
所屬行業:線纜
單位規模:100 - 499人
註冊資金:1299萬
聯繫人:錕斤拷錕斤拷
聯繫人職位:錕斤拷錕斤拷
傳真:xxx-xxxxxxxx
聯繫電話:
電子信箱:[email protected]
通信地址:
郵編:
單位網址:
單位介紹:台錕斤拷錕斤拷業錕斤拷台錕斤拷錕斤拷錕僥碉拷f錕斤拷錕斤拷錕斤拷錕?錕斤拷錕斤拷/錕斤拷錕斤拷
招聘職位:錕斤拷錕斤拷
人數:20人
發布日期:2007-07-17
聯繫人:錕斤拷錕斤拷

原因

我們上網的時候不用去關心網站採用了什麼編碼格式,但是頁面中不時出現的亂碼還是會讓我們頭疼。在這點上,Firefox的用戶更是深有體會,用Firefox瀏覽網頁看到亂碼的機會要比Internet Explorer多得多。 亂碼主要與字元編碼系統有關。例如一個網頁中常出現的亂碼“錕斤拷”(百度,Google),它就是新老編碼系統轉換中出現的。網友est專門寫了一篇文章來考證問題來源:
Unicode和老編碼體系的轉化過程中,肯定有一些字,用Unicode是沒法表示的,Unicode官方用了一個占位符來表示這些文字,這就是:U+FFFD REPLACEMENT CHARACTER。那么U+FFFD的UTF-8編碼出來,恰好是“\xef\xbf\xbd”。如果這個“\xef\xbf\xbd”,重複多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然後放到GBK/CP936/GB2312/GB18030的環境中顯示的話,一個漢字2個位元組,最終的結果就是:錕斤拷——錕(0xEFBF),斤(0xBDEF),拷(0xBFBD)。
Python代碼:
u'\uFFFD'.encode('utf-8')*2'
輸出結果:'\xef\xbf\xbd\xef\xbf\xbd'
print '\xef\xbf\xbd\xef\xbf\xbd'
輸出結果:“錕斤拷”。
print u'\uFFFD'.encode('utf-8')*2
輸出結果:“錕斤拷”。

出現

2011年2月2日零時出現,百度推出搜“紅包”,每一次搜尋都有驚喜活動,錕斤拷亂碼就出現了。
2012年8月31日又出現。通過IE核心的瀏覽器搜尋網頁,無論點開什麼貼吧的超連結都會進入錕斤拷錕斤拷錕斤拷吧。抓包查看發現原因可能是百度bug
2012年12月27日,神一樣的錕斤拷再度出現。在百度新聞首頁的太原市地陷新聞圖片中錕斤拷重複出現。
2013年6月11日零時11分,百度新聞:神舟十號11日17時38分發射 三位航天員公布連結指向神奇的“錕斤拷錕斤拷錕”,零時51分,恢復正常。
2014年2月13日,使用Google Chrome、Firefox等搜尋“李毅”、“dota2”等詞條,點擊貼吧相關連結,會自動跳轉到錕斤拷吧。
2014年8月,打開百度瀏覽器貼吧助手,貼吧名字顯示亂碼,無論點開什麼貼吧,都會直接跳轉到錕斤拷吧。

相關詞條

熱門詞條

聯絡我們