Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

ISO-2022-JPのページが文字化けする #39

Open
kakkokari-gtyih opened this issue Nov 18, 2024 · 2 comments · May be fixed by #40
Open

ISO-2022-JPのページが文字化けする #39

kakkokari-gtyih opened this issue Nov 18, 2024 · 2 comments · May be fixed by #40

Comments

@kakkokari-gtyih
Copy link

What

ashtuchkin/iconv-lite#60

たぶんencoding-japaneseを入れて別で対応すれば何とかなると思う

Steps to reproduce

https://www.comiket.co.jp/info-c/C97/C97genre.html をサマリー

https://misskey.io/notes/a0qpgf0ypa3s007l

@mei23
Copy link

mei23 commented Dec 25, 2024

結局どれを使うのが一番効率がいいのかしらね

encoding-japanese
PureJS JISもサポート (UnicodeとJapaneseのみサポート)

iconv
ネイティブ JISもサポート

iconv-lite
PureJS JISはない
iconv より速いと言っている。ただし対象がwin1251。

@mei23
Copy link

mei23 commented Dec 25, 2024

適当なWebサイトを10000回デコード (エンコーディング間は同サイトを変換したものを使用)

エンコーディング ライブラリ 時間 (ms) 倍率 (iconv 基準)
Shift-JIS iconv-lite 4,782 0.70
iconv 6,815 1.00
encoding-japanese 33,529 4.92
ISO-2022-JP iconv-lite 未サポート -
iconv 7,319 1.00
encoding-japanese 33,471 4.57

どういう組み合わせで使うかはセンス次第だわね

  • 各文字コードの変換を求められる確率と、処理速度のバランス
  • 最適を目指すために複数モジュールを使用する場合に、分岐コードが増えるデメリット
  • ネイティブモジュールをよしとするか

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
2 participants