在使用nodejs request抓取網頁時,如果需要進行轉碼,則須注意request的callback中body是string or buffer
對於Big5來說 如果轉成javascript string, 此時body在iconv(由big5=>utf8)會失敗。 javascript string假設input是utf8
需要強制body保留原始bytes
request({
url: ...,
method: 'GET',
encoding: null
}, function (err, resp, body){ //body is buffer now
});
在說明文件有提到
encoding - encoding to be used on setEncoding of response data. If null, the body is returned as a Buffer.
此時再利用如iconv的工具進行編碼轉換
November 2024 S M T W T F S « Jan 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 -
Recent Posts
Recent Comments
Categories
Links