以下の内容はhttps://m-hiyama.hatenablog.com/entry/20130914/1379130146より取得しました。


続・はてなダイアリーのダウンロード・データ

MT形式については次に書いてありますが、自然言語のみの記述なんでイマイチ厳密性に欠けますなー。

セマンティクスでも、CATEGORY:とTAGS:の使い分けがわかりません。はてなダイアリーではCATEGORY:だけを使っています。仕様では、EXCERPT:(概要)とかKYEWORDS:もあるんですね。トラックバックPING:。だけど、はてなダイアリーではトラックバックは削除されるのでした。

今日わかったことは、MT形式だと自分が書いたコメントがなぜか削除されることです。XML形式とCSV形式ではそういうことはありません。変ですよね。今まで誰も文句を言わなかったのでしょうか? ダウンロード・データなんて、誰もまともに扱おうとしてないってことかも知れませんね。

お引越しに使うくらい?

まともに扱えないデータだから誰も扱わないのか、誰も扱おうとしないからまともじゃないのか …?

ある程度の量のブログデータを、まともに処理する(「まとも」って何? って話はあるけど)って、ほんとに大変ですよ。メタデータや構造を後から与えよう、なんて思うのは僕だけかもしれない。いや、思う人はいるだろうけど、なかなか実行できないですよ。(僕も挫けそうだよ…)




以上の内容はhttps://m-hiyama.hatenablog.com/entry/20130914/1379130146より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14