NAME

    Aozora2Epub - Convert Aozora Bunko XHTML to EPUB

SYNOPSIS

      use Aozora2Epub;
    
      my $book = Aozora2Epub->new("https://www.aozora.gr.jp/cards/000262/files/48074_40209.html");
      $book->to_epub;
    
      # 合本の作成
      $book = Aozora2Epub->new();
      $book->append("000879/card179.html"); # 藪の中
      $book->append("000879/card127.html"); # 羅生門
      $book->title('芥川竜之介作品集');
      $book->to_epub;

DESCRIPTION

    Aozora2Epub は青空文庫のXHTML形式の本をEPUBに変換するモジュールです。

    簡単に合本を生成するためのインタフェースも提供しています。

METHODS

 new

      my $book = Aozora2Epub->new($book_url);
      my $book = Aozora2Epub->new($xhtml_string);
      my $book = Aozora2Epub->new(); # 空のドキュメントを作る

    $bool_urlで指定した青空文庫の本を読み込みます。 あるいは、文字列として指定された整形式のXHTMLを本の内容として読み込みます。

    本は以下のいずれかの形式で指定します。 いずれも、URL先頭の
    https://www.aozora.gr.jp/cards/の部分を省略することが可能です。

    図書カードのURL

      青空文庫の図書カードのURLです。以下に例を示します。

        https://www.aozora.gr.jp/cards/001569/card59761.html
        
        001569/card59761.html # URLの先頭部分を省略

    XHTMLのURL

      青空文庫のXHTMLファイルのURLです。以下に例を示します。

        https://www.aozora.gr.jp/cards/001569/files/59761_74795.html
        
        001569/files/59761_74795.html # URLの先頭部分を省略

 append

      $book->append($book_url);
      $book->append($book_url, title=>"第2部");
      $book->append($book_url, title=>"第2部", title_level=>1); # <h1>第2部</h1>を付加
      $book->append($xhtml_string);

    指定した本の内容を追加します。本の指定方法はnewメソッドと同じです。

    追加される本のタイトルが、追加される本の内容の先頭に <h2>タイトル</h2> という形で付加されます。
    titleオプションによって、このタイトルを指定することができます。 title=>''とすると、ヘッダ要素を追加しません。
    title_levelオプションで、付加されるヘッダ要素のレベルを変更することができます。

 title

      $book->title; # タイトルを取得
      $book->title('随筆集'); # タイトルを設定

    タイトルを取得/設定します。

 author

      $book->author; # 著者を取得
      $book->author('山田太郎'); # 著者を設定

    著者を取得/設定します。

 bib_info

      $book->bib_info; # 奥付の内容を取得
      $book->bib_info(undef); # 奥付を消去

    奥付の内容を取得/設定します。 undefを設定して奥付を消去すると、EPUBに奥付が含まれなくなります。

 to_epub

      $book->to_epub();
      $book->to_epub(output=>'my.epub', cover=>'mycover.jpg');

    EPUBを出力します。オプションは以下の通りです。

    output

      出力するEPUBファイルのパスを指定します。デフォルトは本のタイトル.epubです。

    cover

      表紙のイメージファイルを指定します。JPEGファイルでなければなりません。
      指定しない場合は、表紙イメージを持たないEPUBが出力されます。

 as_html

      my $html = $book->as_html;

    本の内容をHTMLで返します。

合本の作成

    最もシンプルなのは、合本に含めたい本をappendで連結して行くことです。

      my $book = Aozora2Epub->new();
      $book->append("000879/card179.html"); # 藪の中
      $book->append("000879/card127.html"); # 羅生門
      $book->title('芥川竜之介作品集');
      $book->to_epub;

    タイトルはほとんどの場合、明示的に設定することになるでしょう。
    上記の例でタイトルを設定しなかった場合、合本のタイトルは最初の本のタイトル、つまり「藪の中」になります。

    以下は、少し凝った例です。

      my $book = Aozora2Epub->new();
      $book->title('春夏秋冬料理王国');
    
      # 青空文庫の本のタイトルは "「春夏秋冬 料理王国」序にかえて" なので、タイトルを変更する
      $book->append("001403/card59653.html", title=>'序にかえて');
    
      $book->append(q{<h1 class="tobira">料理する心</h1>}); # 中扉を入れる
      $book->append("001403/card54984.html"); # 道は次第に狭し
      $book->append("001403/card50009.html"); # 料理の第一歩
      $book->append(q{<h1 class="tobira">お茶漬の味</h1>});   # 中扉を入れる
      $book->append("001403/card54975.html"); # 納豆の茶漬
      $book->append("001403/card54976.html"); # 海苔の茶漬
    
      # 青空文庫の本のタイトルは "小生のあけくれ" なので変更する。
      # 「お茶漬の味」のサブセクションにならない様に title_level も指定する
      $book->append("001403/card49981.html", title=>'あとがき',
                    title_level=>1);
      $book->to_epub;

    上記のコードは、以下の構造のepubを出力します。

      序にかえて
      料理する心
        道は次第に狭し
        料理の第一歩
      お茶漬の味
        納豆の茶漬け
        æµ·è‹”
      あとがき

青空文庫ファイルのキャッシュ

    青空文庫からファイルを取得する際に、~/.aozora2epub にキャッシュします。 これは環境変数 AOZORA2EPUB_CACHE
    で指定したディレクトリに変更することができます。

    キャッシュされたファイルは30日間有効で、それを過ぎると自動的に削除されます。

AUTHOR

    Yoshimasa Ueno <saltyduck@gmail.com>

COPYRIGHT

    Copyright 2024- Yoshimasa Ueno

LICENSE

    This library is free software; you can redistribute it and/or modify it
    under the same terms as Perl itself.

SEE ALSO

    aozora2epub

    青空文庫 <https://www.aozora.gr.jp/>