健康診断で初めての鼻から胃カメラ

とうとう健康診断で胃の検査が必要な歳になりました。

今年から胃カメラを選択できるようになったので、バリウムは体験せず胃カメラを選択しました。バリウムは何か見つかると結局胃カメラを飲まないといけないのと10数年前に一度口から胃カメラを検査した際ピロリ菌があるかもとのことで当時はがん関係は不明とのことでしたが、今だと原因になりうるようなので胃カメラ一択です。

健康診断

3,5年に一度胃カメラの検査をした方がいいと言われましたが、正直口からの胃カメラはしんどすぎるのでやっておりません。10数年前のことになりますが、記憶に残ってる限りでは口からの胃カメラは麻酔を喉部分で止めて数分、その後胃カメラを口からいれていき胃の部分まで挿入。このとき口からの場合ずっと嘔吐感がありつつ自然と涙が溢れ出てくる感じです。いつ終わるかわからないままずっとおえおえ言いつつ涙を垂れ流す・・・正直もう体験したくありません。

胃カメラ

今回は鼻からの胃カメラです。当時の記憶が蘇りつつも口からよりマシのはずと思い挑んだ結果ですが、10数年の違いもありますし口と鼻との違いに単純に腕の差なのかもしれませんが、正直口からに比べて天国と地獄レベルの違いでした。

まず鼻に麻酔のジェルっぽいのを注入されくだっぽいものを鼻の奥まで挿入、喉の奥あたりに割と苦い感覚がありつつ麻酔が効いた後にくだっぽいものを抜いて鼻から胃カメラを投入。カメラはどんどん鼻の中に入っていき10数年前の記憶にある圧迫感はありつつも嘔吐感はなく胃まで到着。しんどいことはしんどいですが口からに比べたら全然問題ないレベルでした。(個人差があります)

鼻から胃カメラ

強いて言えば終わりまでの時間がわからないので進捗メーターを表示して欲しいぐらいです。そして健康診断はこれからずっと鼻からの胃カメラでいいと思った次第です。

追伸:診断結果でやっぱりピロリ菌の疑い濃厚だったので自費で検査を追加してもらいました。

【Solr】JapaneseReadingFormFilterについて

はじめに

Solrでは、扱う対象の言語に応じた Tokenizer や TokenizerFilter が用意されています。リファレンスに日本語用のものもまとめられています。リファレンスには何故か載っていないもののよく知られているフィルタとして JapaneseReadingFormFilter があります。これは、形態素解析後の単語の読みをインデックスするためのものです。

この JapaneseReadingFormFIlter を使って、漢字の読みで検索できるように設定してみました。

JapaneseReadingFormFilterの基本的な使い方

JapaneseTokenizer を使うフィールドダイプの定義に以下を追加します。

<filter class="solr.JapaneseReadingFormFilterFactory" useRomaji="false"/>

_default コンフィグセットの定義に倣うと、以下のようになります。

    <dynamicField name="*_txt_ja_reading" type="text_ja_reading"  indexed="true"  stored="true"/>
    <fieldType name="text_ja_reading" class="solr.TextField" positionIncrementGap="100" autoGeneratePhraseQueries="false">
      <analyzer>
	<tokenizer class="solr.JapaneseTokenizerFactory" mode="search"/>
        <filter class="solr.JapaneseBaseFormFilterFactory"/>
	<filter class="solr.JapanesePartOfSpeechStopFilterFactory" tags="lang/stoptags_ja.txt" />
        <filter class="solr.CJKWidthFilterFactory"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="lang/stopwords_ja.txt" />
        <filter class="solr.JapaneseKatakanaStemFilterFactory" minimumLength="4"/>
	<filter class="solr.LowerCaseFilterFactory"/>
        <!-- 以下を追加 -->
        <filter class="solr.JapaneseReadingFormFilterFactory" useRomaji="false"/>
      </analyzer>
    </fieldType>

読みで検索できるようにする

JapaneseTokenizer で使われている Kuromoji はカタカナで読みを提供するので、JapaneseReadingFormFilter を通した結果はカタカナでインデックスされます。

[
    {
        "id" : "1",
        "body_txt_ja_reading" : "Solr 8.4 からパッケージ管理機能が追加されました。リファレンスによると、ここでいうパッケージは1つまたは複数のプラグインを1つにまとめたものという意味のようです。Solr におけるパッケージ管理について調べました。"
    },
    {
        "id" : "2",
        "body_txt_ja_reading" : "昨日の午後"
    }
]

この2つの文章をインデックスしたときのタームは以下のようになります。

上の基本的な設定の内容だと、インデックス作成時と検索時とで同じ Tokeinizer の設定になっているで、読みで検索するには不都合です。漢字表記とカタカナ表記とで単語の分割のされ方が異なる場合があるからです。

そこで、入力されたカタカナはそのまま利用するというルールにして、検索時には WhitespaceTokenizer を使うことにします。

   <dynamicField name="*_txt_ja_reading" type="text_ja_reading"  indexed="true"  stored="true"/>
    <fieldType name="text_ja_reading" class="solr.TextField" positionIncrementGap="100" autoGeneratePhraseQueries="false">
      <analyzer type="index">
        <tokenizer class="solr.JapaneseTokenizerFactory" mode="search"/>
        <filter class="solr.JapaneseBaseFormFilterFactory"/>
        <filter class="solr.JapanesePartOfSpeechStopFilterFactory" tags="lang/stoptags_ja.txt" />
        <filter class="solr.CJKWidthFilterFactory"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="lang/stopwords_ja.txt" />
        <filter class="solr.JapaneseKatakanaStemFilterFactory" minimumLength="4"/>
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.JapaneseReadingFormFilterFactory" useRomaji="false"/>
      </analyzer>

      <analyzer type="query">
        <tokenizer class="solr.WhitespaceTokenizerFactory" rule="java"/>
      </analyzer>
    </fieldType>

この設定により、「キノウ」で検索すると文書1と2の両方が、「キノウ ゴゴ」で検索すると文書2だけがヒットするようにできました。

{
  "responseHeader":{
    "zkConnected":true,
    "status":0,
    "QTime":2,
    "params":{
      "q":"キノウ",
      "defType":"edismax",
      "qf":"body_txt_ja_reading",
      "fl":"id,body_txt_ja_reading",
      "stopwords":"true",
      "_":"1606578263384"}},
  "response":{"numFound":2,"start":0,"numFoundExact":true,"docs":[
      {
        "id":"2",
        "body_txt_ja_reading":"昨日の午後"},
      {
        "id":"1",
        "body_txt_ja_reading":"Solr 8.4 からパッケージ管理機能が追加されました。リファレンスによると、ここでいうパッケージは1つまたは複数のプラグインを1つにまとめたものという意味のようです。Solr におけるパッケージ管理について調べました。"}]
  }}
{
  "responseHeader":{
    "zkConnected":true,
    "status":0,
    "QTime":1,
    "params":{
      "q":"キノウ ゴゴ",
      "defType":"edismax",
      "qf":"body_txt_ja_reading",
      "fl":"id,body_txt_ja_reading",
      "q.op":"and",
      "stopwords":"true",
      "_":"1606578263384"}},
  "response":{"numFound":1,"start":0,"numFoundExact":true,"docs":[
      {
        "id":"2",
        "body_txt_ja_reading":"昨日の午後"}]
  }}

普通自動車免許(AT)を取得したその後の話

こんにちわ。
リエです。

2020年に普通自動車免許(AT)を取得したと書きましたが、https://blog.splout.co.jp/12005/

今回はその後のお話です。

実は・・・


免許を取った事に満足し、全然車を運転していません。
気合入れて車のスマホホルダーも買ったのに!
正直もう運転の仕方オボエテナイ。

唯一運転したときは、不安すぎて運転方法の復習をしまくりました。
あと私はバック駐車ができない。
〈余談〉
社内のメンバーにバック駐車ができないという話をした時にめっちゃ驚かれたのですが、教習所での練習って2〜3回なので出来んわ!と反論しました。
路上教習で出発点(車庫)に戻ったときの駐車も前進での車庫入れだったし!

という言い訳もよくないので、季節が春になったら運転がんばります。
今のままだと愛犬とのドライブもリエママから許可もらえないし。
寿命縮んでもいいよという方はぜひ私の運転練習につきあってください。
運転見守り隊(人)を絶賛募集中です。

[Android 11] USBテザリング時の IP アドレスが変わっていた話

Android が 11 にアップデートされてから、
USB テザリングで使われるIPアドレスが変更になっているようです。

Android 10 のときは、USB テザリングを有効にしたときのIPアドレスには 192.168.42.* が使用されていました。

USB、Bluetooth、Wifi のテザリングに加え、
新たに有線LANテザリングに対応した影響ではないかと思います。

 

Windows は設定がおかしいと自動的に別のネットワークで繋いでくれるようで場合によっては気付きにくいかもしれません。

同じような使い方をしている人向けに確認する方法を一応書いておくと、
タスクマネージャーのリソースモニターからネットワークの欄を見ると、
ローカルアドレスとリモートアドレスが表示されています。

 

テザリング時の端末のIPアドレスを固定してしまうと楽かもしれませんが、
仕様変更があったときに面倒なのと、
IPアドレス自体は簡単に分かるので何もしていません。

新しく対応した有線LANテザリングは、
余ったSIMフリー端末でもあれば遊べそうな気はします。

 

脱線しそうなのでここまで。
以上、USBテザリング時に使われるIPアドレスが変わっていたという話でした。

 

192.168.42.* が USB テザリング用に割り当てられるというのは後からググって知った情報ですが、設定が有効だった頃は常に 192.168.42.129 が使われていた気がします。調べてみるとハードコーディングされているという記事がヒットして、それについては自分で確認はしていませんが実際にそうだった可能性はありそうです。 ただ、固定だった場合はUSBやBluetooth複数でテザリングするとどうなるのか試してみたいと思いつつ、その実験のためだけに複数回線を契約するのは厳しい。にも関わらず世の中には実際に複数接続を実現している人もいるようですごい…。

【Solr】3種類の言語判定ライブラリの対応言語

はじめに

Solrでのインデックス作成の際の言語判定には以下の3種類のライブラリが利用できます。

  • Apache Tika
  • LangDetect
  • Apache OpenNLP

ただし、Solrのリファレンスを読んでも、どのライブラリがどの言語をサポートしているかの情報がありません。詳細についてはそれぞれのプロジェクトページを参照するようにと書かれているので確認してみました。

Apache Tika

プロジェクトのページには言語判定について詳しい情報が無かったので、ソースコードを確認しました。

LanguageIdentifierクラスを見ると、各言語のプロファイルとして .ngp という拡張子のファイルを読み込んでいることが分かります。そこで、solr-8.6.1 同梱の tika-core-1.2.jar に含まれる .ngp ファイルをリストアップしました。

$ jar tvf ./contrib/extraction/lib/tika-core-1.24.jar | grep .ngp
 10960 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/be.ngp
 10411 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/ca.ngp
 10004 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/da.ngp
  9999 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/de.ngp
 12664 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/el.ngp
  9897 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/en.ngp
 10292 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/eo.ngp
  9960 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/es.ngp
  9648 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/et.ngp
 11479 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/fa.ngp
 10081 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/fi.ngp
 10050 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/fr.ngp
 10416 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/gl.ngp
  9738 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/hu.ngp
  9301 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/is.ngp
  9960 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/it.ngp
 12509 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/lt.ngp
  9923 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/nl.ngp
  9373 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/no.ngp
  9165 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/pl.ngp
 10023 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/pt.ngp
 10456 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/ro.ngp
 11783 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/ru.ngp
 10431 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/sk.ngp
 10329 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/sl.ngp
 10081 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/sv.ngp
 14302 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/th.ngp
 11942 Wed Mar 11 18:05:28 JST 2020 org/apache/tika/language/uk.ngp

サポートされている言語は28。日本語はサポートされていないようです。

LangDetect

リファレンスからリンクされているプロジェクトページがgithubになっており、ほとんど情報が無いため、こちらもソースコードを確認しました。

profiles というディレクトリの下に各言語のプロファイルが置かれています。

$ ls profiles
af  bg  cs  de  en  et  fi  gu  hi  hu  it  kn  lt  mk  mr  nl  pa  pt  ru  sl  sq  sw  te  tl  uk  vi     zh-tw
ar  bn  da  el  es  fa  fr  he  hr  id  ja  ko  lv  ml  ne  no  pl  ro  sk  so  sv  ta  th  tr  ur  zh-cn

サポートされている言語は53。日本語も含まれています。

Apache OpenNLP

こちらはREADMEにしっかり記載されていました。

サポートされている言語は103。日本語も含まれています。