alisatoの日記

Twitterログなどを格納しておくところ

2023/05/11 (木)

 晴れときどき曇り
 最高21℃ 最低13℃

 ――

twilogデータ整形プログラム つづき

というわけで、一応ツイログのデータを整形するプログラムは一応動いた。
Rubyのバージョンが古くて日付関係の便利機能が一部使えなかったけど、そこは自前でなんとかした。
2013年までは、1ヶ月のデータが500件未満なので、1ヶ月1ファイルにする。
URL文字列がリンクじゃないのは不便なので、そのへんはこれから改善する。

URL文字列をリンクに書き換えるプログラムは検索したら出てきた。
[Ruby][Rails]テキスト内のURLをaタグに書き換える - Qiita
https://qiita.com/satoken0417/items/df4098a122d05d69a3e6

Twitterの@で始まるユーザーIDをリンクに書き換えるプログラムは、Bingチャット君に考えてもらった。
質問は「文字列の中の@から始まる単語をTwitterのユーザーページへのリンクに置き換えるプログラムを書いて」
ちゃんと動くやつを出してくれたので、お礼をいっておいた。

なんとなく動くようになったのでヨシ!
元ファイルをソートして、日付が古いものが上にくるようにした。
引用符内に改行が入るとうまくソートできないので、改行を除去するフィルターツールと作った。
全角空白があるとたまにリンク書き換えがうまくいかないので、全角空白も除去。
変なところは出力ファイルを手作業で直したり。(プログラムを直すよりそっちのが早い)

twilogデータのリンク

ツイログのアーカイブデータの整形は、2010年分が終わって、2011年分へ。
リンクが短縮URLになったので、元URLを手作業で復元してるところ。
URLさえわかればインターネット・アーカイブが使える可能性があるが、to.cの短縮URLTwitterが消えたら元のURLがわからなくなるからね。
2011年の短縮URLは300件ぐらいだから、手作業でもなんとかなる。
2011年のTwitterログのリンクを確認しているんだけど、新聞やNHKのリンクは全滅。
ニフティのhomepageも消滅。
クックパッドと診断メーカーが元気に残ってる。

■リンク

自力での駆除は困難! 国内ではほぼ根絶されていたトコジラミの相談が急増中 防止策は?家で見つけたらどうする? - ライブドアニュース
https://news.livedoor.com/article/detail/24213824/

ニンテンドーアカウント刷新プロジェクトの裏側 27カ月にわたる試行錯誤、キーパーソンが語る:AWS Summit Toky - ITmedia NEWS
https://www.itmedia.co.jp/news/articles/2305/11/news048.html

おると🦴整形外科医@Ortho_FL
https://twitter.com/Ortho_FL/status/1656378562650456064
地震などの天災で避難が必要になった時にマジ見落としがちなのは「常用薬とお薬手帳も持って出る」こと
長期間飲めなかったり、自己注射できなかったりすると命に関わるお薬もあるよ!