過去のいろいろ – ページ 37

4月 1, 2008

Project Euler – 問題1

10より小さい自然数で3または5の倍数であるものを全て列挙すると3,5,6,9である。またその和は23になる。

1000より小さい全ての3または5の倍数の和を求めよ。

まずは小手調べ的な問題。FizzBuzzと言われているものの派生といった感じか。こういう問題をHaskellなら直感的にそのままプログラムにできる。まずリストの内包表記という便利なものがあって、以下のように、|の後ろの条件を満たす要素n全てという風にリストが定義できる。これで問題文の1000より小さい3または5の倍数というのをそのまま書くと、nは1から999までの数で、n を3で割ったあまりが0もしくは5で割ったあまりが0の数でできたリストが生成される。

sumという関数はリストのすべての要素の和を求めるのでこれで問題の解答が得られるというわけだ。modは余りを求める関数であるが`mod`のようにバッククオートでくくることで演算子のように用いることができる。

euler001 = sum [n | n <- [1..999], n `mod` 3 == 0 || n `mod` 5 == 0]

4月 1, 2008

Haskellを使ってProject Eulerに挑戦する

Project Eulerというサイトがある。数学的な（とはいっても専門知識を必要とするようなものではない）問題を解いて答えを入力すると正解かどうか判定してくれるというものだ。問題はどれも人間が手で計算するにはちょっと面倒な設定になっていて、問題を解くプログラムを書いて答えを求めるように意図されている。アカウントを作成して参加し、正解した問題にはチェックがつくというゲーム的な演出もあり、プログラムの演習的な題材としてよくできている。

最近（最近でもないが）Haskellに興味があるのだが、ただ興味があるだけではなかなか身に着かないものなので、Haskellの練習もかねてこのProject Euler の問題に挑戦してみようと思う。Haskellのような関数型言語はこういう演習的な問題を解くのに適しているので、練習の題材としてはちょうどいいと思う。

Haskellの環境を準備するのはこのページの本題ではないので割愛するというか Googleで調べてもらえばいろいろあると思う。とりあえず使用する処理系は ghc。Fedoraマシンで実行しているのでyum install ghcでインストールできた。エディタはemacs。 haskell-mode というのを使えば色もつくし自動でインデントしてくれるので便利だ。というかHaskellの場合レイアウトを使うのが普通なのでインデントしてくれないとかなり大変。他にはhrefというツールもオススメ。これはコマンドラインから使えるHaskellのリファレンスマニュアルで、日本語で説明してあって例もあるので非常に便利だ。

3月 29, 2008

マジックペット

４からデータ引き継いだけど、
ペットは幸運にも卵からやりなおしだったので、
前とは違う名前付けました。

で、名前付けてすぐに予習の並び替え問題で
しゃっくりが出てきて一人笑ったｗ

５になって４より問題が難しい気がする。
現在フェニックス組だが、余裕で１回戦敗退とかする。

しかも、まだ始まったばかりなのに
すでに大賢者とか青銅賢者とかいるのがなんとも・・・

3月 18, 2008

携帯からのアクセスの固体識別

最近DoCoMoの携帯電話からWebアクセスで固体識別のためのIDが出力されるようになった。i-modeの公式サイトでは以前から固体識別ができていたらしい。一般のサイトでもフォームのボタンにutnというオプションをつければ取得できたが、アクセスのたびにユーザがYESを押す必要があった。

今回取得できるIDはこれらのIDとは別物であるらしいが、単に自動ログインなどのためのユーザ識別にはなんら問題がない。特にDoCoMoの携帯はクッキーが使えないのでわりと重要かと思われる。

その使用方法はというと、URLにguid=onという引数をつけることでIDが出力されるらしい。例えば、このサイトにアクセスする場合、 http://www.euphe.net/のかわりにhttp://www.euphe.net/?guid=onというURLでアクセスしてもらえばいい。するとヘッダの中にX-DCMGUIDという項目でIDが送られて来るそうだ。認証用のURLをそういうアドレスにすればいいといってしまえばそれまでだが、トップページで自動ログインしたい場合にあまり美しくないような気がしないでもない。

この値を例えば、apacheのログに出力したい場合、httpd.confのLogFormatに \”%{X-DCMGUID}i\”という項目を追加すればよい。またCGIから利用する場合にはHTTP_X_DCMGUIDという環境変数に入る。perlだと$ENV{‘HTTP_X_DCMGUID’}でアクセスできることになる。

ちなみにAUでは以前からX-UP-SUBNOというヘッダでIDが出ている。とくにURLの制限はない。しかもIDの上4桁でどこの地域で契約した携帯かがわかってしまう。

ソフトバンクの場合はユーザエージェントにIDが埋め込まれている。

3月 18, 2008

HTTPのrefererとiframe

HTTPにはrefererというのがあるのはみなさんご存知だとして、例えばiframeとかあったときにいったいrefererはどっちになるのかみたいなテスト。

このhtmlがreferer01で上の枠の中がiframeで入れ子になったreferer02で、そこにある画像eu.pngのrefererがどうなっているかをログで調べます。

だいたい予想通りですが結果はreferer02でした。なんかこれを利用するとrefererでhogeからしか利用できないようにアクセス制限していてもhugaによく見えないiframeでhogeを貼ればいいじゃんとかいうことになる気がします。気のせいかな。

3月 18, 2008

RSSリーダの巡回頻度をチェックする

全く持って自己満足以外の何者でもない企画だが、 RSSリーダの巡回をapacheのログでチェックして悦に入るのはどうだろうという試み。全く更新しないサイト、１日に１回更新するサイト、１時間に１回更新するサイトを作ってそれぞれ調べてみよう。対象とするRSSリーダはとりあえずgoogle readerとlivedoor readerでいいかな。念のためサイトはそれぞれ別アドレスとしよう。

まずはサイトの設定。 apacheのバーチャルドメインで rss1.euphe.net, rss2.euphe.net, rss3.euphe.net を作る。１から順に更新しないサイト、１日１回更新するサイト、１時間に１回更新するサイトにしよう。それぞれアクセスログは別にした方が後で楽かな。エラーログは１個でいいや。設定はこんな感じ。あとnamedも設定しないとアクセスできないな。

<VirtualHost *:80>
    DocumentRoot "/var/www/html-rss1"
    ServerName rss1.euphe.net
    ErrorLog logs/rss-error_log
    CustomLog logs/rss1-access_log combined
</VirtualHost>

さすがに手動で更新するわけにもいかないので、自動でサイトとRSSを更新するスクリプトを作ってcronで動かすことにしよう。内容は更新時刻のみ。われながらすげーｗ。

そしてgoogle readerとrss readerに登録。無事登録できた。あとはログ解析だな。とりあえず解析するのは面倒なので貼り付けよう。

全く更新しないサイト

一日一回更新するサイト

一時間に一回更新するサイト
これでまあ実際どうなるか知らないが何か結果が出るかも。

とりあえず数時間に一度巡回に来てるのはわかった。だがしかし、どうやら単一エントリを書き換えてるだけではRSSリーダで新着と認識されないようだ。悩ましい。

3月 18, 2008

RSSを手書きする

こちらのサイトを参考にして手書きで最小限のRSSを作ってみる。内容はこのページそのもの。更新を知るためとかそういうことは考えない。

<?xml version="1.0"?>
<rss version="2.0">
  <channel>
    <title>ゆーふぇみずむ</title>
    <link>http://www.euphe.net/</link>
    <description>いろいろメモ的なことを書くサイトです。</description>
    <language>ja</language>
    <pubDate>Thu, 28 Feb 2008 18:36:58 +0900</pubDate>
    <item>
      <title>RSSを手書きする</title>
      <link>http://www.euphe.net/memo/rss02.html</link>
      <description> ここは実際は本文 </description>
      <pubDate>Thu, 28 Feb 2008 18:36:58 +0900</pubDate>
    </item>
  </channel>
</rss>

そしてこのページをgoogle readerに登録したら表示できた。わーい。

3月 18, 2008

RSSのバージョンについて

サイトの内容を機械的に処理しやすいような形式で配布する規格であるところのRSSには現在おもに使われているバージョンが二つある。それぞれ1.0と2.0であるが、単に2.0が1.0の新しいバージョンというわけではないらしい。RSSの詳しい説明やその辺の経緯については Wikipediaの説明（ここ）を見て欲しい。

普段見るブログの状況をぱっと調べてたみたのが以下の表。結構1.0が多いな。個人的には個人が自分でRSSを使う分には2.0を使っていればいいように思ってたのがさてさて。

yaplog	1.0
ameblo	2.0
fc2	1.0
livedoor	1.0 (+Atom)
goo	1.0
yahoo	2.0
rakuten	1.0
jugem	1.0 (+Atom)
hatena	1.0 + 2.0
petitmall	1.0

3月 18, 2008

文字コードはutf-8にしよう

特に理由はない。最近はutf-8が標準かなと。今さらshift-jisとかあれだし。既存のファイルはnkf -wで変換できる。 emacsだと左から４文字目がuだったらutf-8みたい。

3月 18, 2008

XHTMLでサイトを作る

ウェブサイトいうのは基本的にはHTMLという言語で書かれたテキストで構成されているのだが、そのテキストの作成方法には大きく分けて自動生成ツールを使うという方法と手書きで入力するという方法がある。

大昔にはツールというの存在しなくて、人が手でソースを書くというのが当然だったわけだが、その後ホームページビルダーのようなWYSIWYG（死語？）的なツールも使われるようになって、最近だとCMS的なものを使ってサイトを構築することも多いと思う。

だが自分用のちょっとしたサイトを作るのにそんな大それたものを使いたくないし、たいした量のない自分のサイトくらい自分で把握していたいと思う人も少なくないと思う。そういうちょっとしたツールのプログラムを書くのにRADは使わないというような考えの人なら、HTMLも手書きで書こうかなと思うのではというお話。

前置きが長くなったが、そういう背景でHTMLを書こうと思ったときに、どうせなら新しいバージョンの規格に従って書くのがモチベーションもあがっていいと思う。HTML4.0は無難かもしれないが、今ならXHTML、それもバージョン1.0じゃなくて1.1と思って少し調べてみた。

まず思うのは、HTMLとXHTMLって違いはいったい何なんだということ。仕様を全部読むのも不可能ではないが、@IT に簡単な比較があったのでそれを参考にする。ただしこれは多少昔の記事である。細かくは色々と違いがあると思うが、基本的には大きな違いはないと思う。特にわざわざ手書きでHTMLを書こうという人にとっては、最初のおまじないが必須であるとか、タグは小文字で書くとか、要素は引用符でくくるとか、開いたタグは閉じるとかは言われなくても実行しているくらいではないだろうか。要素が空のタグの閉じ方が目新しいかもしれない。「<br>」は「<br />」と書くことで閉じることができる。

バージョンの違いについてもいろいろ検索してみると、1.1は厳格なので問題になる場合もあるようだ。例えばContent-TypeがHTML4.0で推奨されていた text/htmlが非推奨になり、application/xhtml+xmlが推奨になっているが、実際には多くのウェブサーバはHTTPレスポンスでtext/htmlを返していたり、IEが対応していなかったりなかなか難しいようである。しかし、ここは自分用のちょっとしたサイトということで、あまり細かいところは気にせず、新しい XHTML1.1を使っていくことにする。

実際に書いたHTMLが正しいかどうかをチェックしてくれるサイトとしては、 Another HTML-lintというのが有名らしい。仕様とにらめっこしながら書くよりは、ここでチェックして文句を言われたところを修正する方がお手軽だろう。ただし、ここのチェックはかなり厳しい。オプションで軽度なチェックや宗教的なチェックはオフにするのがいいと思う。それでも十分厳しいかもしれないが減点の少ないエラーは無視してもいいかもしれない。

ここのチェックを使ってて気がついたのは、厳密にはbodyタグの中にはinline 要素は書いてはいけないということである。これはなかなか盲点だと思う。例えば、bodyタグの中に直接文章が書いてあったりしたらだめなのだ。