世界樹の迷宮3、ちょこちょこ進めてます。現在は第五階層、20階を探索中。あんまり面白くて日記に書く暇もないな! なんというジレンマ。


あとすみません、マガジン・サンデーの更新チェックがどうも正常に動いていないっぽいです。利用サイト、利用者の方にはご迷惑をおかけします。早いところ原因を調べて修正します。<拍手返信>
>どうやら『赤マルジャンプ』が『ジャンプNEXT!』になるようですね。これまで通り春夏冬に刊行されるようなので、更新チェック条件を『ジャンプネクスト』『〜NEXT』にするだけで済みそうですが…対応されるんでしょうか?
これは初耳でした。ほぼ「名前だけ変わる」という感じみたいなので対応も楽だと思います。次の発売までには対応したいです。
情報ありがとうございましたー。

                                                                                                                  • -


『扇情ミスリード雑記』
タイトルに意味はありません。105円均一さんにご意見いただいたので、お礼がてら更新チェックのこととか散漫に書いてみるよのコーナー。


・とりあえず最初に、現在の更新処理手順でも。

1 サイトテキスト取得
1-1 wininet.dllを使って各サイトのURLにアクセス
1-2 生HTML取得、とりあえずdat形式でローカル保存
1-3 文字コード変換
  (以上を登録サイト数分だけ繰り返す)
2 更新チェック処理
2-1 保存したdatファイルよりサイトテキスト取得
2-2 週刊ジャンプの更新チェック処理
2-3 ジャンプスクエアの更新チェック処理
2-4 赤マルジャンプの更新チェック処理
2-5 週刊サンデーの更新チェック処理
2-6 週刊マガジンの更新チェック処理
2-7 週刊チャンピオンの更新チェック処理
  (チェックは主にinstr関数を利用)
  (以上を登録サイト数分だけ繰り返す)
3 HTML作成&アップロード
3-1 更新年→更新号→更新日→更新時間の順でソート
3-2 各雑誌チェックページ用HTMLファイル作成
3-3 アップロード
  (以上を週刊ジャンプ〜週刊チャンピオンの6誌分だけ繰り返す)
以上1〜3を、1時間に1回(X時00分に)実行


・現在の登録サイト数は193。一通りの処理をするのに、現在210〜240秒程度の時間が掛かっています。
たまにこれよりも遅く更新されることがありますが、そういう時というのは何か別のことでPCが忙しくしている時になります。セキュリティソフトのパターンアップデートとか。俺がゲームしてたりとか。


・それぞれの処理の時間比率としては、

1-1,1-2 140〜150秒
1-3 10〜20秒
2 60〜70秒(全サイト分で)
3 2秒(6誌分で)

といった所です。


・1-1が一番時間を喰ってます。どうしても早くしたいというならば、PCを買い換える、ネット回線を太くする等で手っ取り早くスピードアップはしそうですが、まあ最後の手段ということで。
「余計なサイトは見に行かないようにする」という風にすればだいぶ早くなるんじゃないかな、と前回思ったんですが、何か105円均一さんのテキスト読んだりこのテキスト書いてたりしたらまた別なことが浮かんできたぞ。
今まではURLのHTMLデータを馬鹿正直に取得してきてそこから色々こねくり回して調査してたたんですが、その前に「そのURLが最後に更新された日付・時間はいつか」みたいなのを調べるプロパティとかあるんじゃないだろうか…。
何かいろいろと迂闊ではありますが、ちょっと調べてみます。


・このプログラムはINIファイルでデータを保存してます。こんなの→とこんなの→を組み合わせた感じでデータ管理してます。軽くて小回りが利くということでこの形式にしたのですが、反面、一般データベースのような複雑なデータの蓄積・参照があまりできないという弱点も。
「それぞれの曜日での更新頻度データの蓄積」等はとても有用で実装できたら素晴らしいと思うのでが、現状では少し難しいかもしれません…。すみません。


・更新時間の「分」の情報は、言われてみればほとんど意味がないですねえ。一応ソートには使ってるんですが、そもそも処理を行うのがサイトごとにあらかじめ振ってるIDの順番ですし。IDの順番イコール更新された順番となるわけで、同じ「時」に拾ったサイトはいつも同じ順番に並びます。
J-Linksさんの形を真似して作ったのでとりあえず表示してましたが、確かに必要でもないのかもしれないな。分表記をやめるのも特に面倒な改造ではないです。
でもまあ、利用者さん方がちょっと戸惑わないかな、とかは少し心配ではあります。


・「後は6ページを全部見るよりは最終24時間内検出だけの1ページの方が利便性が高いのかなと」はこれはもう確かに!と言った感じでした。そういうページがあった方が確実に便利だと思うので、近いうちにちょっと作ってみようと思います。


・なんだかコードを直接見て貰った方が早いような気もしてきた。