mastodon などの ActivityPub サーバー上に投稿された内容から 575 調の文章を発見する bot、俳句検出 bot(@[email protected])を運用しています1。

2018 年 1 月頃から運用しています。当初は theboss.tech で動作していましたが、同サーバー閉鎖に伴い botdon.net に移転、botdon.net も終了したため現在のサーバー https://social.timespiral.co.jp に移転して動作しています。
Ruby 製です。ソースコードは GitHub にて公開しています。
theoria24/FindHaiku4Mstdn
偶然にもトゥートの中に俳句を見つけた俺たちは…
Ruby
28
3
辞書は mecab-ipadic-NEologd に依存しており、mecab-ipadic-NEologd が 2020 年 9 月頃から更新されていないため、それ以降の新語が検出できない状況です。これの対策を検討しておりますがなかなか実行できていません。うちではこうしてるよという情報があれば教えてほしいです。
ITmedia NEWS に掲載されました → マストドン 俳句があれば 見つけ出す:マストドンつまみ食い日記 - ITmedia NEWS
-
季語を判定していないため厳密には俳句ではありません。また、575 調でなくても俳句として成立する場合があるため俳句をすべて検出できるわけでもありません。 ↩︎