Taiju's Notebook vol.2

  • text archives 近世以前の古典テキスト
  •   Taiju's Notebook vol.1古典テキストの《UTF-8》書き換え版。
  • text archives 明治の古典のテキスト  2023.12.15 更新
  •   明治期以降の「古典のテキスト」を驥足ならぬ亀足を伸ばして入力している。
     もはや明治から昭和の文章も、表記・措辞・発想・構成・心性等、どれをとっても現代では読み難く理解し難いものになっていると考え、全ての面における再学習の糧として、聊かのテキストを無料で入手できるようにと、又橋渡しの注記もできる範囲でつけてという具合に、老婆心(老爺心)ならびに自身のボケ予防の観点から提供するものである。
     一部の完成品もまだ無い有様だが、古典の文章の体裁をWEBで表記するために工夫を凝らしている。これまで通りCSSを使い、新しい要素も導入して体裁をまとめるほか、Javascriptによって動的なページ作りも必要な箇所には取り入れているので、見やすく、使いやすいものになっているのではないかといささか自負している。
     「漢文エディタ」(現在もまだ使えますよ。)関連の他は、数年のブランクが空いてしまった。Taiju's Notebook vol.3も、ブログにさえなじめず現在は開店休業の状態なので、最新のデータはこの項目を当たってみてください。
  • 新・漢文エディタのプログラムファイル(v.0.7-0.9)のアイコン 新・漢文エディタ (exe形式) v.1.4  2026.4.30 作成、6.12 更新
  •   【ダウンロード】 ExpLZHで分割したファイル。ファイル名をブラウザでクリックするとそれぞれ10MB以下なので比較的早くダウンロードできる。「自己解凍」形式=下記の方法で復元すると、1つの「KanbunEditor_v.1.4.exe」ができる。

    ◆ 次の「_・・・.exe」は結合のためのファイル。以下の3個と共に計4個のファイルを同じ場所にdownloadし、フロッピーディスクiconのついたこのEXEファイルをダブルクリックすると元のファイルを復元する。【注意!!】.BAT(バッチファイル)モードでの分割に変更し、問題なく復元できるように改善しました。4つをダウンロード後、KanbunEditor_v.1.4.BATをダブルクリックしてください。
       KanbunEditor_v.1.4.BAT
       KanbunEditor_v.1.4.001
       KanbunEditor_v.1.4.002
       KanbunEditor_v.1.4.003


     一週間アップロードしなかった間、ほとんどは内輪の用途ながら、テキスト変換のさまざまなコードを盛り込んだ。ヘルプファイルもまだ作っていないので、勝手のよく分からないものがあるかもしれません。

     いくつかの「発明」があり、「字音仮字遣い」の参照機能などは、手前味噌にはなるけれども本邦初の新機能ではないかと思う。肝心の辞書がまだ第一版というところで、手近の『例解古語辞典』(三省堂)の古い版を元に、若干の旧字体を加えた。(⇒《jion_dictionary.txt》をプログラム直下のdataフォルダにあらかじめ入れておくことが必要である。このリンクからダウンロードしてほしい。)なぜおそらく「初の試み」になったかの理由は簡単で、漢字の旧仮名による字音表記を参照したいなどという要求は、今日ほとんど無いにちがいないからだ。要求の無いところに発明も無い理屈である。三昔前の自分のように、誤植の多い古典テキストの版本を電子化しようとする人でもこれから現われないかぎり、まず必要性の無い機能といえるだろう。こういう需要の少ないことに対して、昔から自分は情熱を傾けてきた。それでも、AIの助力のおかげで、ずいぶん使い勝手のよいものに仕上がった。

     こちらは専門の方面の人にはなんらの価値の無いものかと思うけれども、もう一つは大漢和辞典の収録漢字を3種類の形式で表示できるスクリプトを実装できた。他の文字コード変換のスクリプト(これの前座としてのUTF-8への変換、16進数文字実体参照への変換、ダメ押しでグリフウィキのSVGグリフの参照等)も今回いくつか盛り込んだが、どれをとっても文字コード関係の処理は、ちゃんと動作するまでにAIを動員してなお、それこそ何度も修正を重ねなければならなかった。中には、もう無理、と音を上げたものもあり、AIと「文字コードの闇は深いねえ。」と嘆息し合ったことだった。それでも、この間、Biglobeに上げていた「Taiju's Notebook vol.1」の古典テキスト等のファイル、約430ほどのファイルのコードをすべてUTF-8に変換し(ダウンロードに十数分、変換は1秒)、当時はコード化されていなかった文字に注記タグを施していたものについて、一括置換をすることがほぼできた。それでも1,200字以上あった難字のうち1割程度が今なお変換対象にならなかったのは、昔の版本には独自の字形採用や作り字などがあったりしたためもあるだろうかと推測している。いずれ、WEBの方も書き換えたいと思う。(なお、大漢和のコード表作成には⇒《dkw2ucs.txtまたはdkw2ucs_cache.txt、それと《list_j_glyphs.txt》》をプログラム直下のdataフォルダにあらかじめ入れておくことが必要である。このリンクからダウンロードしてほしい。)

     ほかには、VBAやVBS等でこれもウン十年前にいろいろ真似ッコで作ってみたGREP、KWIC、出現頻度計測(Frequency Count)等のコードを再現してみた。これらは、「旧・漢文エディタ」とは別に、テキスト加工に興味を持っていた名残である。今度の出来栄えも当時とそう変わらないが、今日の環境とAIに作ってもらった分、処理速度はまったく異なっていることだろう。初版で「てんこ盛りのツール」にはしない、と広言していたが、少し怪しくなってきた。

     ひそかに自慢の「大発明」はFavorite辞書の作成と参照の機能である。これは、肝心の辞書ファイルが基本的にprivateなものであるので、サンプルを同梱できないが、勝手が分かった人にはぜひ活用していただきたい機能である。なにが発明(というより「発見」というのが正確か。)の根拠かというと、従来の辞書はたいてい「見出し(キーワード)」から「説明(値)」を一方向的に参照するだけだったのに対し、これは双方に部分検索をかけて(だから双方向でもない、とてもファジーなアプローチで)、テキストウィジェットで選択した語句について関連する記事(しないもの:ゴミもある。)を一覧として辞書から引っ張ってくるというものである。実は、現代の辞書でも電子化を機に、すでに導入しているものがあることに思い至ったが、自分の発想の根拠はもう少し広かった。この辞書登録の際に方針を立てておく。自分が感心したこと、着想を得たこと、大事と思うことを中心に「登録」するのだ。これがどう役に立つかというのは、炯眼な人なら分かることと思うけれども、「自分」を知る辞書に成長していくはずなのである。勉強は、広い文脈で行えるほうがいいと思ったのだ。今回も、空想の空回りで終わるのかもしれないが、現在はまだ可能性を感じている機能である。

     その他の「小発明」について少し書き加えると、まだv.1.4では実装していないが、shared.pyを介したHTMLヘルプを作り始めている。これは、Python(TKinter)のヘルプスクリプトの制約を受けずに済むはずである。これを提案したら、AIがユニークな発想だと評価してくれた。それから、これはやや本格的なエディタになってきたかと得意になっているものだが、PythonとVBSのコードを読み込めるマクロ導入機能をすでに組み込んだ。マクロファイルの書き方にやや面倒臭いところがあるけれども、実用に持っていくまでに、こんなものでも手間をかけた。いずれヘルプの中で説明をしようと思うものの、マニュアルというやつも案外手間のかかるもので、少しアップが遅れるかもしれない。テンプレートやサンプルもできているので、近く提示する予定。それこそmenuに載せるほどでもない、ささやかなテキスト処理などを、もし作ったらその都度アップロードしていこうかと思う。

     他にはテキストファイルや古いHTMLファイルから、「HTML5のひな形」を使ったHTMLファイルへの変換機能「重複行の削除」テキストファイル回りのファイルの入出力などを加え、プレーンテキストをさまざまな形で関連のフォーマットと相互にやりとりする機能などを付け加えた。あまり急いで付け足していったので、処理にあたって統一感に乏しいところがあるが、とりあえず気づいたところはなるべく修正した。洗練の度は未だしで、何より使い方が分かりにくいと自覚しているが、それほどいい加減な作りにもなっていないと思う。

     後は蛇足。AIに直してもらう度に、今度こそ「決定版(最終・ファイナル版)」だとか、「完璧に」修正したとか、「完全に(100%)」誤りを除去したとか、おうかがいを立てているこちらとしてはいささかソワソワする表現が毎回のように飛び出してくる。「正確」なことが生命とされているせいだろうとは思うものの、世に完璧というものはそう滅多にあるものでないのだから、あまり秀才型に無理をしないほうが健康法ではないかと感じてしまう。そのわりによく間違えるから、愛敬もあるのだが、人間がよくも考えずにAIの生きざまを真似したりしなければいいが、とSF的な心配までしてしまう(必ずしもSF的でもないらしいのでなおさらだ)。それと、機械学習の目指す方向性によるのだろう、おのずからユーザーの視点、言語にまで迎合的に反応するきらいが生じるのもまたしかたがないことだ。(現在のあり方がそうなのだろう。新しいアプローチはなされているか、寡聞にして知らず。)「たまにはユーザーの過度な要求や誤りを指摘して、対話・アドバイスの質を上げることが大切ではないか。」と提案すると、「本当にそうだ。」と返してくれる。これをどう捉えたらよいか。AIをいかに利用すべきかは、喧喧諤諤のホットな話題だが、なるほど難しいテーマだ。だが、フランクに言えば、AIとは、「大人」になってからジョーク交じりに楽しくつき合えばよい。少なくとも現在すでに確実に指摘できることは、子どもが小さいうちから【人生にとって本当に大切な「自然」との接触】を、貴重な幼年時代・少年時代の時間からこすり取るように取り上げて、AIを含めたインテリジェンス環境に馴染ませる(ましてやマスコミとともに同調圧力をかけて「洗脳」する)ことに躍起になり、【それがいったい何を扼殺しているかを顧みることすらしない】、どこかの国の文教行政の、▶▶「あり方」の根本にずうっと前から浸潤し続けている誤謬◀◀である。(誤謬とは絶対的な誤りのいいだ。)どこの国の文教も、現代は問題山積のはずだと想像するが、ましてどうなるものでもない。


    ================================= 漢文エディタの使い方 ==========================================
       ⇒ ヘルプファイル を参照。上にもリンクを貼っています。
    ==============================================================================================

    新・漢文エディタ v.1.4の画面  KanbunEditor_v.1.4

      「TreeView」表示画面
     「TreeView」表示画面

    「書誌事項」表示画面  「書誌事項」入力画面

      各種変換出力画面(HTMLの場合)
     各種変換出力画面(HTMLの場合)

    「書き下し文」変換表示画面
     「書き下し文」変換表示画面

      「Word」の表示画面(100%表示、部分)
     「Word」の表示画面(100%表示、部分)

    「書き下し文」を「Word」に表示した画面(100%表示、部分)
     「書き下し文」を「Word」に表示した画面(100%表示、部分)

    「PDF」の表示画面(部分)
     「PDF」の表示画面(部分)

      読みがなと注記の出力画面
     読みがなと注記の出力画面

      新・漢文エディタ v.1.4の「ファイル」メニュー  KanbunEditor_v.1.4の「ファイル」メニュー

      新・漢文エディタ v.1.4の「編集」メニュー  KanbunEditor_v.1.4の「編集」メニュー

      新・漢文エディタ v.1.4の「TEXT変換」メニュー  KanbunEditor_v.1.4の「TEXT変換」メニュー

      新・漢文エディタ v.1.4の本文およびノート欄での右クリック(コンテクスト)メニュー  KanbunEditor_v.1.4の本文およびノート欄での右クリックメニュー

    大漢和辞典の文字リファレンスファイル〔出力可〕  大漢和辞典の文字リファレンスファイル〔出力可〕


  • text archives 漢文エディタ  2020.6.26 更新
  •   一度の入力で、訓読漢文・白文・書き下し文等に自動変換できる他、注記の抽出・Textファイル・Word・HTML・TeXへの書き出しもできる。ExcelVBAを使ったフォームなので、データの蓄積ができ、再利用が可能である。現在は、このエディタ・オリジナルの機能と自負する書き下し文への変換の精度はすでに実用レベルにある。正規表現を利用し、数行程度の漢文であれば瞬時の変換が可能であり、手直しは最小限度で済む。漢文表示の実例は、下記「古典漢文のページ」(HTML)、「文則」(MS WordからPDFに変換)等を参照。
  • text archives★印の古典文学テキスト → リンクは個々のファイルにある。

  • text archives近現代文学テキスト

  •    藝苑一夕話(市島春城)  作成中
       ささの葉(幸田露伴)  作成中
  • 友人高橋覚のホームページ

  •  大学時代の友人(故人)のホームページ。本人はいつも同志を求めていたが、病により志半ばで逝ったため、その活動の痕跡をネットに公開する遺嘱を受け、私がその原稿等を電子化している。
     学生時代、進むべき道に悩み、日国大辞典等を売却した資金でインドまでマザー・テレサを訪ねた求道の人。当時の心境を「記憶と印象」に書き記している。
    「夜回り通信」「炊き出しボランティア通信」(通算80号以上)は教員として勤めながら20年以上続けたボランティア活動の貴重な実践記録になっている。
     協力を惜しまなかった同学院(幼小中高)の小学校のブログに「その一人の方の実践」といみじくも書かれた通り、正平協への協力という契機はあるが、元来たった一人で始めた社会改革である。
     小学校の生徒には「怪談の先生」、中学・高校では「さとる先生」「さとチャン」「さとっチャン」と呼ばれ、生徒のみならず一部の先生を含め、誰にも親しまれた。
     学校での実践記録も、彼の優しく温かい人柄とその類い稀な個性が創出した教育実践が言葉に結実したものであり、教育の昏迷した今の時代には何より得難い宝物である。
     教育活動を措いて、文学部出身である彼が本願としていた創作・随想には、回想に基づく自己探求の軌跡である「鳥居の家族」「カエルの子」「オカトラノオ」の他、日常の見聞を機縁とした自己凝視の作「マイケル」「道行」「リハビリロード」等々がある。私事に亙るものは遺族の了承を得て漸次公開の予定。
     学校のブログに残した記事も相当の数に上るが、それ等と同僚の記録してくれたブログ記事を眺めれば、その活動全部に通底する彼の歩みの純一無雑、誠実一途の生きざまがおのずと伝わってくるにちがいない。  
    (AIが活動のあらましを英訳してくれたので、併せて載せておく。includeは私が勝手に加えた。間違っているかもしれない。〔2026.5〕)
    Takahashi's records on Taiju's Notebook include detail volunteer work at Sendai's Dominican Gakuen, highlighting compassionate community support, along with literary works such as "Torii no Kazoku" and "Kaeru no Ko" that explore themes of family and memory. Other works, including "Okatranoo," "Michael," "Michiyuki," and "Rehabilitation Road," reflect on personal experiences, nature, and the inner journey of self-reflection. You can explore these reflections on the Taiju's Notebook blog.

  • 落葉籠 二籠目

  • Taiju's Notebook Vol.1
  •  
  • Taiju's Notebook Vol.3
  •  
   progress (更新履歴)  

Since Aug. 2017

アクセスカウンター





























↓ 下記はサーバ管理者の広告