{"id":21285587,"url":"https://github.com/takeyuweb/mt-plugin-htmlimporter","last_synced_at":"2025-03-15T15:13:26.083Z","repository":{"id":8597420,"uuid":"10233645","full_name":"takeyuweb/mt-plugin-htmlimporter","owner":"takeyuweb","description":"既存の静的ウェブサイトからMovableType上への移行を支援する、HTMLインポーターです。","archived":false,"fork":false,"pushed_at":"2013-10-30T09:54:13.000Z","size":216,"stargazers_count":3,"open_issues_count":0,"forks_count":0,"subscribers_count":2,"default_branch":"master","last_synced_at":"2025-01-22T05:16:20.817Z","etag":null,"topics":[],"latest_commit_sha":null,"homepage":"","language":"Perl","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":null,"status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/takeyuweb.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":null,"code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null}},"created_at":"2013-05-23T01:41:26.000Z","updated_at":"2016-04-05T01:31:33.000Z","dependencies_parsed_at":"2022-08-27T16:50:25.370Z","dependency_job_id":null,"html_url":"https://github.com/takeyuweb/mt-plugin-htmlimporter","commit_stats":null,"previous_names":[],"tags_count":0,"template":false,"template_full_name":null,"repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/takeyuweb%2Fmt-plugin-htmlimporter","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/takeyuweb%2Fmt-plugin-htmlimporter/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/takeyuweb%2Fmt-plugin-htmlimporter/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/takeyuweb%2Fmt-plugin-htmlimporter/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/takeyuweb","download_url":"https://codeload.github.com/takeyuweb/mt-plugin-htmlimporter/tar.gz/refs/heads/master","host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":243746230,"owners_count":20341203,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":[],"created_at":"2024-11-21T11:21:17.288Z","updated_at":"2025-03-15T15:13:26.063Z","avatar_url":"https://github.com/takeyuweb.png","language":"Perl","funding_links":[],"categories":[],"sub_categories":[],"readme":"HTML Importer for Movable Type\r\n===========\r\n\r\n* Author:: Yuichi Takeuchi \u003cuzuki05@takeyu-web.com\u003e\r\n* Website:: http://takeyu-web.com/\r\n* Copyright:: Copyright 2013 Yuichi Takeuchi\r\n* License:: MIT License\r\n\r\n既存の静的ウェブサイトからMovableType上への移行を支援する、HTMLインポーターです。\r\n\r\n本プラグインを用いて、1000ページ程度のDreamweaverで作成されたサイトをMovableType上にインポートしており、それなりに使えるはずです。\r\n\r\n## 機能\r\n\r\n* インポート元の指定\r\n  * 指定したディレクトリ以下の一括インポート\r\n    * 対象ディレクトリを複数指定可能\r\n    * 除外パスを複数指定可能（前方一致）\r\n  * 指定したファイル一覧の一括インポート\r\n* 柔軟なインポートルール\r\n  * インポート元データソースとインポート先フィールド名によるルールを複数指定できる\r\n    例) インポート元「.wrap .content」 → インポート先「本文（text）」\r\n    * データソース\r\n      * CSSセレクタ または 正規表現 で抽出可能\r\n    * インポート先\r\n      * ウェブページの各フィールド（タイトル、本文、続き、キーワード、概要）\r\n      * カスタムフィールド\r\n* 「フォルダ」構造の維持\r\n  * MovableType上の「フォルダ」の自動生成\r\n* アイテムインポート\r\n  * 記事中に含まれる画像ファイルやリンク先のPDFなどのファイルをウェブページアイテムとして自動登録\r\n* インポートスクリプトを用いた自動インポート\r\n* コールバックによる拡張\r\n* 無償＆無保証\r\n  * サポートが必要な方は、他の有償プロダクトをお求め下さい\r\n  * 何が起こっても開発者は一切責任を負いません\r\n\r\n##画面サンプル\r\n\r\n![画面サンプル](https://raw.github.com/uzuki05/mt-plugin-htmlimporter/master/main.png)\r\n\r\n\r\n## 依存モジュール\r\n\r\n* HTML::Selector::XPath \r\n* HTML::TreeBuilder::XPath\r\n\r\n## バックグラウンド処理\r\n\r\nMovableType標準の機構を利用して、時間のかかるインポートをバックグラウンドで実行することができます。\r\n\r\n    #mt-config.cgi\r\n    LaunchBackgroundTasks 1\r\n\r\nただし、PSGI動作時の時は、バックグラウンド処理は無効になります。（MTのバックグラウンド処理機構が無効化されるため）\r\n\r\n## スクリプトを用いた自動インポート\r\n\r\n`plugins/HTMLImporter/sample/tools/sync-from-html`にプラグインの機能を利用して、大量のページを取り込むための作業支援スクリプトのサンプルを含めています。\r\n\r\n## プラグインによる拡張\r\n\r\nコールバックを利用してインポート処理を拡張できます。\r\n\r\nサンプルとして`plugins/HTMLImporter/sample/plugins/SyncCheck`に、カスタムフィールドの値をチェックして上書きインポートを行うかどうか判断するプラグインを含めています。\r\n\r\n## コールバック\r\n\r\n### cms\\_pre_htmlimport.page\r\n\r\nインポートされたウェブページが保存される前に呼ばれます。\r\n偽を返すことで保存せずスキップします。\r\n\r\n    # カスタムフィールド page_skip_htmlimport が真のときインポートしないサンプル\r\n    # 例えば、インポート済みのウェブページについて、「上書き」が選択されても上書きしたくないときなど\r\n    sub _cb_cms_pre_htmlimport_page {\r\n        my ( $cb, $app, $obj, $original ) = @_;\r\n        \r\n        my $field = 'field.page_skip_htmlimport';\r\n        if ( $obj-\u003e$field ) {\r\n            return $app-\u003eerror( 'Skipped.' );\r\n        } else {\r\n            return 1;\r\n        }\r\n    }\r\n\r\n### cms\\_post_htmlimport.page\r\n\r\nインポートされたウェブページや記事アイテムなどが保存された後に呼ばれます。\r\n\r\n    sub _cb_cms_post_htmlimport_page {\r\n        my ( $cb, $app, $obj, $original ) = @_;\r\n        \r\n        # インポートされたウェブページオブジェクトについての処理\r\n        \r\n        1;\r\n    }\r\n\r\n##Contributing to HTML Importer\r\n\r\nFork, fix, then send me a pull request.\r\n\r\n##Copyright\r\n© 2013 Yuichi Takeuchi, released under the MIT license\r\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Ftakeyuweb%2Fmt-plugin-htmlimporter","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Ftakeyuweb%2Fmt-plugin-htmlimporter","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Ftakeyuweb%2Fmt-plugin-htmlimporter/lists"}