2008 年 4 月 8 日 – 11:42 AM

photo credit: Tjflex2
「コンテンツをやりたいWebプログラマ」との雑談でした話を整理してます。
ホームページ、CGM、Webサイト
- 全てが人為的、手作業による構築(ツール云々はおいといて)
- オリジナルコンテンツが作成される
Planet、FriendFeedなどのアグリゲータサイト
- テーマにそった選定が人為的、収集は自動的
- フィードを通してコピーされたコンテンツ
- 「テーマ」や「友達」というくくりで、程よい『空気感』がつくりやすい
ネタ蔵などのキーワード収集サイト
- キーワードの選定が人為的、あとは自動的(場合によってはスパムサイトになりえる)
- フィードやAPIを通してコピーされたコンテンツ
- 『空気感』はサイト独自のものになり、コピー元の作成者が文句をいうこともありえる
検索エンジン
- 全てが自動化されている、作成されたアルゴリズムが全て。アルゴリズムは日々進化?しているはず
- クローラーがコピーしてインデックスしたコンテンツ
『コンテンツをやりたい』人なんで、当然メディアとしてのWebサイトに興味が強く、こういう話になりました。
だから特別なサービスや機能を提供するWebサイトってのはこの分類には入ってません。
2008 年 2 月 28 日 – 3:48 AM

photo credit: Mr Clambake
サイトリニューアル直後なもんで、リダイレクトや404の確認のために、screenのセッションでアクセスログをtail -Fで流しっぱなしなんですが、始めて見るUserAgentがいくつかありました。
たいていのUserAgentでは、営業かっ!ってつっこみたくなるくらいURLが埋め込んであるもんなんですが、なんだかあやしげなのがあったのです。
211.18.198.29 - - [28/Feb/2008:03:36:34 +0900] “GET /robots.txt HTTP/1.1″ 200 24 “-” “netasbot/1.0″
211.18.198.29 - - [28/Feb/2008:03:36:35 +0900] “GET /ryo/feed/ HTTP/1.0″ 301 308 “-” “netasbot/1.0″
211.18.198.29 - - [28/Feb/2008:03:36:35 +0900] “GET /feed/ HTTP/1.0″ 302 293 “-” “netasbot/1.0″
続きを読む »
2008 年 2 月 26 日 – 4:55 AM

photo credit: geognerd
リニューアルついでに、RSSをfeedburnerで配信するように設定したのですが、feedburnerにサインアップするとき、いわゆるひとつの「SSL証明書の有効期限が切れています」警告がでました。
実際 https://www.feedburner.jp/ のSSL証明書の有効期限が2/15/2008で切れているようで、サポートにメールしておきましたが、Googleに買収されたWeb2.0企業がこんなミスをしちゃうんだから、インターネットなんてある意味いい加減なものですな(笑)
続きを読む »
2008 年 2 月 25 日 – 10:01 PM

photo credit: Jusbe
ryo.comのサーバーを引っ越して、サイトもリニューアルしました。
WordPress 2.3で構築して、「ほそいりょすけのほめぱげ」として運用していたブログと、GetSenやベイエリアPlanetなどのページを統合しました。
リンク切れもあまりないようにmod_rewriteを使ったリダイレクトも仕込んでありますので、そんなに気にせず使っていただけるかと思われ・・・
ryo.comのメールサーバーを変更しました
# ついにqmailからさらばしてpostfixへ移行したのです
つきましては、ryo{atmark}ryo.comなんていう、かなり昔つかってたアドレスは、unknownで届かないので、僕にメールを送る人は注意してくださいませ
ryo.comのアドレスでのメール転送してる人の分は一通り移行してあるので大丈夫なはずですが、もし届かない人がいたら教えてください
2008 年 1 月 19 日 – 10:29 PM
ユーザーアカウントのテーブルのログインIDで
login_name VARCHAR(256) NOT NULL UNIQUE
なんて指定でユニークキーを貼ったのはいいが、Case SensitiveなIDになってしまい、気が付いたら大文字小文字を使い分けられてgdgdになる
# だけど「はてな」はMySQLじゃなかったの?って知らないけど
# どちらにせよはてながPostgreSQLだとは思ってません。もしかしてDBM?;)
続きを読む »
2007 年 11 月 8 日 – 10:51 AM
インターネットはコピペまみれですよ。
続きを読む »
日本のブログサービスではRSS1.0を採用してるところが多いそうだ
嘘か真か知らないが、理由はkanzaki.comやhyuki.comなどの日本語のコンテンツで、RSS2.0じゃなくRSS1.0の解説が多かったからだとか
何を見てフィードをつくってもいいと思うし、どのフィードをサポートするのも自由だとは思うけど、変な実装は困るよね
gooブログのフィードの場合
RSS1.0を採用しているが、タイトル中の‘を‘に勝手に変換してる、よくわからない仕様
自前で実装してサニタイズしてる間にこんなことになってしまったんだろうか?
こういうのを見ると文字の扱いを全然知らない人が実装してるんじゃないの?って感じて、逆に脆弱性ありそうに思える
amebloのフィードの場合
負荷が大変だそうで
現在、サーバ負荷軽減のため、19:00-25:00の間、RSS配信を一時的に停止させていただいております。
なんて出すのはいいけど、HTTPのステータスコード200のままこんなの返すなっつーの
200のままエラーを返すと、フィードリーダーで読んでる人間は読めばわかるかもしれないけど、ロボットの類は全滅というか、そのままキャッシュしてしまうわけです
こんなの返すなら503あたりを使うべきですな