<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
		xmlns:xhtml="http://www.w3.org/1999/xhtml"
>

<channel>
	<title>ryo.com &#187; getsen</title>
	<atom:link href="http://www.ryo.com/tag/getsen/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.ryo.com</link>
	<description>by Ryosuke Hosoi</description>
	<lastBuildDate>Sat, 19 Feb 2011 14:20:06 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
<xhtml:link rel="alternate" media="handheld" type="text/html" href="http://www.ryo.com/tag/getsen/feed/" />
<atom:link rel="hub" href="http://pubsubhubbub.appspot.com"/><atom:link rel="hub" href="http://superfeedr.com/hubbub"/><cloud domain='www.ryo.com' port='80' path='/?rsscloud=notify' registerProcedure='' protocol='http-post' />
		<item>
		<title>GetSenでRSS/ATOMフィードを流し読み</title>
		<link>http://www.ryo.com/2005/06/10/52/</link>
		<comments>http://www.ryo.com/2005/06/10/52/#comments</comments>
		<pubDate>Sat, 11 Jun 2005 03:49:05 +0000</pubDate>
		<dc:creator>りょすけ</dc:creator>
				<category><![CDATA[IT関連]]></category>
		<category><![CDATA[feed]]></category>
		<category><![CDATA[getsen]]></category>
		<category><![CDATA[php]]></category>

		<guid isPermaLink="false">http://www.ryo.com/ryo/?p=52</guid>
		<description><![CDATA[GetSenでもうちょっと遊んでみようってことで、GetSen Readerをつくってみました。 (サンプル) FPNを流し読み うーん、いい感じかも 100SHIKIを流し読み 目をひく(が中身がわかりにくい)タイトル [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.ryo.com/getsen/">GetSen</a>でもうちょっと遊んでみようってことで、<a href="http://www.ryo.com/getsenreader/">GetSen Reader</a>をつくってみました。</p>
<p>(サンプル)<br />
<a href="/getsenreader/?feedurl=http%3A%2F%2Fwww.future-planning.net%2Fx%2Fbackend.php">FPNを流し読み</a><br />
うーん、いい感じかも</p>
<p><a href="/getsenreader/?feedurl=http%3A%2F%2Fwww.100shiki.com%2Fatom.xml">100SHIKIを流し読み</a><br />
目をひく(が中身がわかりにくい)タイトルに対しズバリの一文が抜け出せてる、と思わない？</p>
<p>PHP+XML/RPC(Pear)+MagpieRSSで、なかなかの生産性です。</p>
<p>(6/13 100SHIKIを追加)<br />
(6/18 Open Alexandriaを追加)</p>
<p>(2/25/2008 いろいろ削除)</p>
<h3  class="related_post_title">関連記事</h3><ul class="related_post"><li><a href="http://www.ryo.com/2007/08/02/340/" title="XML_Feed_Parserでdc:subject要素を読み込む">XML_Feed_Parserでdc:subject要素を読み込む</a></li><li><a href="http://www.ryo.com/2007/05/14/319/" title="MagpieRSSが嫌われた？">MagpieRSSが嫌われた？</a></li><li><a href="http://www.ryo.com/2009/09/09/1000/" title="RSSは生きてるんで、rsscloudのプラグインも入れてみたけど・・・">RSSは生きてるんで、rsscloudのプラグインも入れてみたけど・・・</a></li><li><a href="http://www.ryo.com/2009/09/04/991/" title="PubSubHubBubのpubに対応する">PubSubHubBubのpubに対応する</a></li><li><a href="http://www.ryo.com/2008/03/02/419/" title="XCache for WordPressでトラブル">XCache for WordPressでトラブル</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.ryo.com/2005/06/10/52/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	<xhtml:link rel="alternate" media="handheld" type="text/html" href="http://www.ryo.com/2005/06/10/52/" />
	</item>
		<item>
		<title>GetSen XML-RPC API</title>
		<link>http://www.ryo.com/2005/06/03/45/</link>
		<comments>http://www.ryo.com/2005/06/03/45/#comments</comments>
		<pubDate>Fri, 03 Jun 2005 09:27:05 +0000</pubDate>
		<dc:creator>りょすけ</dc:creator>
				<category><![CDATA[IT関連]]></category>
		<category><![CDATA[getsen]]></category>
		<category><![CDATA[web]]></category>

		<guid isPermaLink="false">http://www.ryo.com/ryo/?p=45</guid>
		<description><![CDATA[GetSenのXML-RPCインターフェースをおいときます Service URI http://www.ryo.com/getsen/rpc.php 別の書き方 Server: www.ryo.com Port: 80 [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.ryo.com/getsen/">GetSen</a>のXML-RPCインターフェースをおいときます<br />
<span id="more-45"></span></p>
<h3>Service URI</h3>
<blockquote><p>http://www.ryo.com/getsen/rpc.php</p></blockquote>
<p>別の書き方</p>
<blockquote><p>Server: www.ryo.com<br />
Port: 80<br />
Path: /getsen/rpc.php</p></blockquote>
<h3 title="methodName">ryocomJapanese.getsen</h3>
<p>GetSenを使用して、日本語の文章からサマリ(要約)を取り出します</p>
<h4 title="Params">引数</h4>
<p>String  copus // サマリ抽出の対象とする日本語の文章</p>
<h4>返り値</h4>
<p>String summarySentence // 抽出されたサマリ(要約文)</p>
<h4>注意事項</h4>
<p>通信に使用される文字コードはUTF-8を期待しています。<br />
phpで動作しており、スクリプトの実行時間が30秒を越えるとphpの実行エラーになります（大きすぎるテキストを投げるとそうなるので、青空文庫から一章まるごと投げたりするような無謀なことはやめてください、一冊なんてもっての他です）</p>
<h3  class="related_post_title">関連記事</h3><ul class="related_post"><li><a href="http://www.ryo.com/2005/06/01/43/" title="GetSenで自分のエントリを切り出す">GetSenで自分のエントリを切り出す</a></li><li><a href="http://www.ryo.com/2005/06/01/41/" title="GetSenでアノ人のblogを切り出す">GetSenでアノ人のblogを切り出す</a></li><li><a href="http://www.ryo.com/2005/06/01/40/" title="GetSenで新聞記事を切り出す">GetSenで新聞記事を切り出す</a></li><li><a href="http://www.ryo.com/2005/06/01/39/" title="GetSen 日本語文章サマリ抽出システム">GetSen 日本語文章サマリ抽出システム</a></li><li><a href="http://www.ryo.com/2009/06/15/957/" title="TMJのホームページへようこそ">TMJのホームページへようこそ</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.ryo.com/2005/06/03/45/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
	<xhtml:link rel="alternate" media="handheld" type="text/html" href="http://www.ryo.com/2005/06/03/45/" />
	</item>
		<item>
		<title>GetSenで自分のエントリを切り出す</title>
		<link>http://www.ryo.com/2005/06/01/43/</link>
		<comments>http://www.ryo.com/2005/06/01/43/#comments</comments>
		<pubDate>Wed, 01 Jun 2005 13:15:17 +0000</pubDate>
		<dc:creator>りょすけ</dc:creator>
				<category><![CDATA[IT関連]]></category>
		<category><![CDATA[getsen]]></category>
		<category><![CDATA[web]]></category>

		<guid isPermaLink="false">http://www.ryo.com/ryo/?p=43</guid>
		<description><![CDATA[じゃ、さらにGetSenで自分のblogのエントリを切り出してみます。同様にタイトルと抽出されたサマリを引用していきます。 はたして僕の文章は何かを誰かに伝えようとしているのでしょうか？ はてなRSS グループ(フォルダ [...]]]></description>
			<content:encoded><![CDATA[<p>じゃ、さらに<a href="http://www.ryo.com/getsen/">GetSen</a>で自分のblogのエントリを切り出してみます。同様にタイトルと抽出されたサマリを引用していきます。<br />
はたして僕の文章は何かを誰かに伝えようとしているのでしょうか？<br />
<span id="more-43"></span></p>
<blockquote><p><a href="http://www.ryo.com/2005/05/21/4/">はてなRSS</a><br />
グループ(フォルダ的なもの)に入れたRSSがまとめてつくり直されるところが便利なんだけど、これってどう考えても、パブリックモードで利用する限りは、元サイトからしたら再配布。
</p></blockquote>
<p>実は一番いいたいことが出たぞ。。。</p>
<blockquote><p>
<a href="http://www.ryo.com/2005/05/28/31/">ECにおける厨房化</a><br />
 消費税総額表示なんてものすごい例で、国民の厨房化を法令で推奨した上、既存のコンピューターシステムに対して足かせをかけるというマヌケっぷりですから・・・</p></blockquote>
<p>一番最後の文だ。。。けどまあ、内容からすると狙い通り？</p>
<blockquote><p><a href="http://www.ryo.com/2005/06/01/42/">ユーザビリティって言ったもの勝ち！ってワケじゃないよ</a><br />
Jakob Nielsen博士も「同じシステムを違うユーザが違う作業に使えば、対象とするユーザビリティ特性も違うという結果になりかねません。(中略)ユーザビリティ測定はテスト作業の形態、つまりどのユーザビリティ特性を測定するのかを決定するところからスタートするのです。」といっています。 </p></blockquote>
<p>引用部分かよ！なんだかなぁ〜</p>
<h3  class="related_post_title">関連記事</h3><ul class="related_post"><li><a href="http://www.ryo.com/2005/06/03/45/" title="GetSen XML-RPC API">GetSen XML-RPC API</a></li><li><a href="http://www.ryo.com/2005/06/01/41/" title="GetSenでアノ人のblogを切り出す">GetSenでアノ人のblogを切り出す</a></li><li><a href="http://www.ryo.com/2005/06/01/40/" title="GetSenで新聞記事を切り出す">GetSenで新聞記事を切り出す</a></li><li><a href="http://www.ryo.com/2005/06/01/39/" title="GetSen 日本語文章サマリ抽出システム">GetSen 日本語文章サマリ抽出システム</a></li><li><a href="http://www.ryo.com/2009/06/15/957/" title="TMJのホームページへようこそ">TMJのホームページへようこそ</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.ryo.com/2005/06/01/43/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	<xhtml:link rel="alternate" media="handheld" type="text/html" href="http://www.ryo.com/2005/06/01/43/" />
	</item>
		<item>
		<title>GetSenでアノ人のblogを切り出す</title>
		<link>http://www.ryo.com/2005/06/01/41/</link>
		<comments>http://www.ryo.com/2005/06/01/41/#comments</comments>
		<pubDate>Wed, 01 Jun 2005 08:45:54 +0000</pubDate>
		<dc:creator>りょすけ</dc:creator>
				<category><![CDATA[IT関連]]></category>
		<category><![CDATA[getsen]]></category>
		<category><![CDATA[web]]></category>

		<guid isPermaLink="false">http://www.ryo.com/ryo/?p=41</guid>
		<description><![CDATA[じゃ、次はGetSenでblogのエントリを切り出してみます。新聞記事と同様にタイトルと抽出されたサマリを引用していきます。 blogというのは、その人の人間性がでるなんていわれたりしますが、この機械的なGetSenが人 [...]]]></description>
			<content:encoded><![CDATA[<p>じゃ、次は<a href="http://www.ryo.com/getsen/">GetSen</a>でblogのエントリを切り出してみます。新聞記事と同様にタイトルと抽出されたサマリを引用していきます。<br />
blogというのは、<b>その人の人間性がでる</b>なんていわれたりしますが、この機械的な<a href="http://www.ryo.com/getsen/">GetSen</a>が人間性を計ることができるとは到底思えません。どうなるんでしょう？<br />
<span id="more-41"></span></p>
<blockquote><p><a href="http://blog.livedoor.jp/takapon_ceo/archives/23750912.html">5/30(月) 京都の夜は長かった！</a><br />
京都駅には修学旅行生が一杯!その後京都造形芸術大学で、4月から新たに教授になった、秋元康氏と対談形式の講義。</p></blockquote>
<blockquote><p><a href="http://blog.livedoor.jp/takapon_ceo/archives/23565127.html">5/29(日) やまけんの結婚披露宴</a><br />
 唯我独尊のカレーも旨かった!たぶんこの辺の模様はやまけんの食い倒れブログで明らかになることだろう。</p></blockquote>
<blockquote><p><a href="http://blog.livedoor.jp/takapon_ceo/archives/23564625.html">5/28(土) ライブドアクーポンなどなど</a><br />
ビアガーデンがあるらしいのですが、夏の夜にはいい感じかもしれません!式が終わったら、西麻布のカラオケ</p></blockquote>
<p><a href="http://www.ryo.com/2005/06/01/40/">新聞記事の例</a>に比べると、なんだかわけがわかりません。が、リンク先にいってエントリを読んでみると、ホントにたいして情報がないことがわかります。<br />
ここでもっと情報を書くべきだという批判はまとはずれで、彼の場合、自社製品を紹介するのがメインなので、そもそもたいした情報を書こうとしてないのです。</p>
<h3  class="related_post_title">関連記事</h3><ul class="related_post"><li><a href="http://www.ryo.com/2005/06/03/45/" title="GetSen XML-RPC API">GetSen XML-RPC API</a></li><li><a href="http://www.ryo.com/2005/06/01/43/" title="GetSenで自分のエントリを切り出す">GetSenで自分のエントリを切り出す</a></li><li><a href="http://www.ryo.com/2005/06/01/40/" title="GetSenで新聞記事を切り出す">GetSenで新聞記事を切り出す</a></li><li><a href="http://www.ryo.com/2005/06/01/39/" title="GetSen 日本語文章サマリ抽出システム">GetSen 日本語文章サマリ抽出システム</a></li><li><a href="http://www.ryo.com/2009/06/15/957/" title="TMJのホームページへようこそ">TMJのホームページへようこそ</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.ryo.com/2005/06/01/41/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
	<xhtml:link rel="alternate" media="handheld" type="text/html" href="http://www.ryo.com/2005/06/01/41/" />
	</item>
		<item>
		<title>GetSenで新聞記事を切り出す</title>
		<link>http://www.ryo.com/2005/06/01/40/</link>
		<comments>http://www.ryo.com/2005/06/01/40/#comments</comments>
		<pubDate>Wed, 01 Jun 2005 08:16:31 +0000</pubDate>
		<dc:creator>りょすけ</dc:creator>
				<category><![CDATA[IT関連]]></category>
		<category><![CDATA[getsen]]></category>
		<category><![CDATA[web]]></category>

		<guid isPermaLink="false">http://www.ryo.com/ryo/?p=40</guid>
		<description><![CDATA[GetSenで新聞記事を切り出す例として、対象記事の見出しと抽出されたサマリを引用していきます 基本的に新聞記事という文章では、最初の一文に重要なことを書くように求められるわけですが、そういう具合いになっているというのが [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.ryo.com/getsen/">GetSen</a>で新聞記事を切り出す例として、対象記事の見出しと抽出されたサマリを引用していきます<br />
基本的に新聞記事という文章では、<b>最初の一文に重要なことを書く</b>ように求められるわけですが、そういう具合いになっているというのがわかります。<br />
<span id="more-40"></span></p>
<blockquote><p><a href="http://www.asahi.com/national/update/0601/OSK200506010028.html">ガルーダ航空機、乱気流で乗客ら１０人けが　関空行き</a><br />
 1日午前6時ごろ、デンパサル(インドネシア・バリ島)発関西空港行きのガルーダ・インドネシア航空882便(エアバスA330型機、乗客161人、乗員14人)が、沖縄上空付近で乱気流に巻き込まれた。</p></blockquote>
<blockquote><p><a href="http://www.asahi.com/national/update/0601/TKY200506010203.html">差し押さえピカソの「顔」、２千万円で落札　神奈川</a><br />
差し押さえオークションのピカソの絵は2000万円――神奈川県庁大会議室で1日午前、県税を滞納した美術業者から県が差し押さえたピカソの絵画「顔」 (縦28.3センチ、横21.6センチ)のオークションがあり、30代の中国人夫婦が2000万円で落札した。</p></blockquote>
<blockquote><p><a href="http://www.asahi.com/national/update/0601/TKY200506010213.html">脱線想定し復旧訓練　ＪＲ東日本八王子支社</a><br />
 林康雄支社長は訓練に先立って4月25日に兵庫県尼崎市のJR宝塚線(福知山線)で起きた脱線事故に触れ、「事故を教訓に今後も安全の確保に努めてほしい」と訓示した。</p></blockquote>
<blockquote><p><a href="http://www.asahi.com/national/update/0601/TKY200506010232.html">横浜市が滞納業者と家庭ごみ委託契約　入札拒む規定なし</a><br />
同市では企業や学校などから出る事業系ごみは各事業者と個別に契約した処理業者が集めた後、市のごみ焼却施設で処理する際に1キロ当たり13円の手数料を市に後納する仕組みになっている。</p></blockquote>
<p>上の２つでは先頭の文が、下の２つでは真ん中あたりの文が選ばれてます。<br />
しかし、この記事見出しと抽出された文章だけで、流し読みとしては十分情報が得られると感じられませんか？</p>
<h3  class="related_post_title">関連記事</h3><ul class="related_post"><li><a href="http://www.ryo.com/2005/06/03/45/" title="GetSen XML-RPC API">GetSen XML-RPC API</a></li><li><a href="http://www.ryo.com/2005/06/01/43/" title="GetSenで自分のエントリを切り出す">GetSenで自分のエントリを切り出す</a></li><li><a href="http://www.ryo.com/2005/06/01/41/" title="GetSenでアノ人のblogを切り出す">GetSenでアノ人のblogを切り出す</a></li><li><a href="http://www.ryo.com/2005/06/01/39/" title="GetSen 日本語文章サマリ抽出システム">GetSen 日本語文章サマリ抽出システム</a></li><li><a href="http://www.ryo.com/2009/06/15/957/" title="TMJのホームページへようこそ">TMJのホームページへようこそ</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.ryo.com/2005/06/01/40/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
	<xhtml:link rel="alternate" media="handheld" type="text/html" href="http://www.ryo.com/2005/06/01/40/" />
	</item>
		<item>
		<title>GetSen 日本語文章サマリ抽出システム</title>
		<link>http://www.ryo.com/2005/06/01/39/</link>
		<comments>http://www.ryo.com/2005/06/01/39/#comments</comments>
		<pubDate>Wed, 01 Jun 2005 07:24:08 +0000</pubDate>
		<dc:creator>りょすけ</dc:creator>
				<category><![CDATA[IT関連]]></category>
		<category><![CDATA[getsen]]></category>
		<category><![CDATA[web]]></category>

		<guid isPermaLink="false">http://www.ryo.com/ryo/?p=39</guid>
		<description><![CDATA[以前書いてたやつ、とりあえず公開です。 とりあえず使ってみるには、GetSenフォームインターフェースをどうぞ GetSenとは？ GetSenとは Get Sentence の略で、複数の文で構成される日本語の文章から [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.ryo.com/2005/05/29/34/">以前書いてた</a>やつ、とりあえず公開です。<br />
とりあえず使ってみるには、<a href="http://www.ryo.com/getsen/">GetSenフォームインターフェース</a>をどうぞ</p>
<h3>GetSenとは？</h3>
<p>GetSenとは Get Sentence の略で、複数の文で構成される日本語の文章から、代表的な一文を機械的に取り出すためのひとつの実装です。</p>
<h3>GetSenの仕組み</h3>
<ol>
<li>文章を文に分割します</li>
<li><a href="http://gensen.dl.itc.u-tokyo.ac.jp/">専門用語（キーワード）自動抽出システム</a>と同じ仕組みでキーワードおよび単語のスコアリングを行います。</li>
<li>文中に含まれるキーワードと単語から、文そのものスコアを決定します。</li>
<li>文のスコアが一番高いものを、要約文とみなします</li>
</ol>
<h3>よくあるんじゃないかって思った質問と回答</h3>
<p><strong>なんでこんなのつくったの？</strong><br />
<a href="http://gensen.dl.itc.u-tokyo.ac.jp/">専門用語（キーワード）自動抽出システム</a>を見てムラムラしたからです。名前もGensenをパチってます。<br />
あと、<a href="http://www.remus.dti.ne.jp/~a-satomi/nikki/2003/06c.html#d27n01">RSS の description の自然言語要約を AppleScript に任せた </a>を見て、AppleScriptが羨ましくなったのですが、そんなことのためにOSXを買うわけにもいかず、また、AppleScript同様にベクトル演算して抽出するのも芸がないような気がしたので、単純な実装をしてみたのです。</p>
<p><strong>フォームインターフェース以外の方法で使わせてください</strong><br />
ってゆう人が多かったら考えます。ってゆーか今時はXMLRPCとかがいいの？SOAPは勘弁してくれますか？</p>
<p><strong>じゃ、ソースコードください</strong><br />
えーと、一部勤務先で書いたものが含まれていて、ライセンスの関係で厳しいのです。<br />
けど、実装は上に書いた通りで簡単なので、自分でやってください。</p>
<p><strong>意味がさっぱりわかりません</strong><br />
ごめんなさい。</p>
<p><strong>文句がいいたいんですけど・・・</strong><br />
お手数ですけどコメントでもトラックバックでもしてください。</p>
<p><strong>で、これどーやって遊ぶの？</strong><br />
たとえば、新聞社の記事を丸ごといれると、かなりイイ感じに重要なセンテンスを抽出できます。<br />
記事の見出しとこれで抽出した文だけ流し読みすれば、ニュースジャンキーにはたまらない感じですよ。<br />
これをRSSリーダに組み込めば、contentからイイ感じに要約できる可能性がちょっとだけある気がします。<br />
あと、自分で適当に書いた文章を入れてみると、いかに自分の文章が<abbr title="そもそも言いたいことなどなにもない">何が言いたいのかわからない</abbr>ってことがわかっていいかも。</p>
<h3  class="related_post_title">関連記事</h3><ul class="related_post"><li><a href="http://www.ryo.com/2005/06/03/45/" title="GetSen XML-RPC API">GetSen XML-RPC API</a></li><li><a href="http://www.ryo.com/2005/06/01/43/" title="GetSenで自分のエントリを切り出す">GetSenで自分のエントリを切り出す</a></li><li><a href="http://www.ryo.com/2005/06/01/41/" title="GetSenでアノ人のblogを切り出す">GetSenでアノ人のblogを切り出す</a></li><li><a href="http://www.ryo.com/2005/06/01/40/" title="GetSenで新聞記事を切り出す">GetSenで新聞記事を切り出す</a></li><li><a href="http://www.ryo.com/2009/06/15/957/" title="TMJのホームページへようこそ">TMJのホームページへようこそ</a></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.ryo.com/2005/06/01/39/feed/</wfw:commentRss>
		<slash:comments>9</slash:comments>
	<xhtml:link rel="alternate" media="handheld" type="text/html" href="http://www.ryo.com/2005/06/01/39/" />
	</item>
	</channel>
</rss>

