aozora-ruby-parser

Aozora-bunko ruby parser


Keywords
novel
License
Apache-2.0
Install
bower install aozora-ruby-parser

Documentation

aozora-ruby-parser

Build Status

青空文庫っぽい記法のルビを解釈するよ

オンラインデモ

続きはウェブで

Screen shot

文法

青空文庫工作員作業マニュアル 2.入力-1にある仕様のうち、ルビと[改ページ]タグのみをサポートします。その他の記法(見出しや傍点など)は、何も加工しません。

実際のところ、このライブラリは青空文庫の記法に厳格に従ったものではありません。JIS漢字コード (JIS X 0201, JIS X 0208, JIS X 0213) を前提とする青空文庫に対して、入出力に Unicode を許容すると、その性質上、「文字種」の定義が煩雑になるからです。

そのため、本ライブラリでルビの始点指示|なしで利用できるのは漢字とASCIIの範囲のアルファベットと数字、全角アルファベットと数字のみです。一部の処理系との互換性のため、ひらがなカタカナを始点指示|なしでルビに分解することはありません。

このパーサーが保証する入力と出力はtest/parseRegExpTest.jsを参照してください。

API

  • parser = new AozoraRubyParser(input_text: string)
    • パーサーオブジェクトを生成します
  • parser.perse()
    • パース処理を実行します。
      副作用としてparse.nodesにパースされたオブジェクトの配列がセットされます
  • parser.render(template: object): string
    • templateで渡されたオブジェクトに実装されたメソッドを利用してノードを文字列化して一つの文字列に結合します

出力

パースに成功すると、オブジェクトの配列を生成します。オブジェクトはTextNodeとRubyNodeとNewpageNodeの三種類です。ノードの種類はtypeプロパティの文字列text|ruby|newlineで判定することができます。

全ての種類のノードはtextプロパティを持ちます。また、RubyNodeはrtプロパティを持ちます。すべてのノードのtextプロパティを結合することで、原文からふりがなを省いたテキストを得ることができます。

フォーマットを追加する

node.typeと同じ名前のメソッドを持ったオブジェクト(変換器)を parser.render() に渡してやることで、独自のフォーマットに変換することができます。

このライブラリに付属する変換器は拡張性を持たせるためにnew AozoraRubyHTMLConverterのように初期化しますが、単純な変換器は以下のようにシンプルな実装で十分です。

var simple_converter = {
    text: function(node){ return node.text; },
    ruby: function(node){ return node.text + "(" + node.rt + ")"; },
    newpage: function(node){ return "\n\n"; }
}
var output = parser.render(simple_converter));

インストール

Bower

bower install aozora-ruby-parser

npm

Node.js でちゃんと動くかはよくわかんない

npm install aozora-ruby-parser

著作権

本リポジトリに含まれるファイルは以下の条件に基き配布されます。 (後述のsim2ruby.cssを除く)

aozora-ruby-parser.js
Copyright 2014 USAMI Kenta <tadsan@zonu.me>

Licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in compliance with the License.
You may obtain a copy of the License at

    http://www.apache.org/licenses/LICENSE-2.0

Unless required by applicable law or agreed to in writing, software
distributed under the License is distributed on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
See the License for the specific language governing permissions and
limitations under the License.

sim2ruby.css

sim2ruby.css は http://roheisen.net/dl/sim2ruby.css を改変したものです。

名称

sim2ruby.css | シム・トゥ・ルビー・シーエスエス

sim2ruby.css = a cascading style sheet to simulate simple ruby.

機能概要

IE以外のブラウザでもルビタグ(振り仮名表示機能)を同じように機能させるCSSです。 “simulate simple ruby”の名前の通り、rtcやrbcなどの複雑ルビには未対応です。

著作概要

使用条件

個人・法人・営利・非営利問わずご自由にお使いください。 邪魔ならここの枠を丸ごと消してしまっても結構です。 ただし、虚偽の著作主張だけはご勘弁願います。