Not only is the Internet dead, it's starting to smell really bad.:2018年09月分

2018/09/01(Sat)

[Editor] Atom

Atomときいて真っ先にX11/XAtom.hのXA_*が頭を過ぎるおじいちゃんはここではありません。

ギフハブ公式エディタの AtomをGFM(GitHub Flavored Markdown)のプレビュー機能目当てで使いはじめたんだがエディタとしては常用する気にならんなこれ。

@エディタペインで入力してるコードブロック中の_や*でシンタックスハイライトが壊れる

Markdownにおいて_や*は斜体あるいは2つ重ねて太字にするキーワードなんだけど、コードブロック中ではキーワードとして扱われずそのまま表示される。

にもかかわらずAtomはシンタックハイライト時にコードブロック中でもキーワードと認識してしまって表示が崩れる。

なもんで*や_が頻出するプログラミング言語Cのコードを引用する文書書いてると常用に耐えんですわこれ…

いちおうIssueには上がってる( #44)けど、解決策としてGitHubの開発者はC書いてるジジイをこの世から抹殺するべしくらいに思ってそうだし直らなさそうだな。

まぁシンタックスハイライトや入力補完とはほぼ無縁のエディタ常用してるから、このへんぜんぶオフにすりゃいいんですけどね…

@改行コードを開いたファイルのAS ISにする設定が無い

line-ending-selectorというpackageのデフォルト設定がOS DefaultでWindows上で使うと開いたファイルがLFだろうがCRLFにされてしまう上に、その他の設定にAS ISで元の改行コードを尊重するというモードが無いのよね。

人類はもう何十年も前にftpのバイナリ/ASCIIモードとかWinCVSの改行コード自動変換みたいなソリューションは禍根を残すだけであって、滅ぼすべきはメモ帳を代表とするクソエディタの方だと学んだはずなんだけどな…また新たなクソエディタを生んでどうすんねんや。

Windows 10の国際化Webサービスのウン国際化でも感じたんだけども、ユーザーエクスペリエンス(笑)重視でここ2~30年くらいで蓄積された地味なユーザーインタフェースに関わる知恵といったものが失われて、車輪ならぬ不幸の再発明のフェーズに入ったのかなぁと。

まーそもそも名前にSimpleがつくプロトコルは全てComplicatedという悪夢みたいに、数年単位ですら不幸の再発明が得意な業界だから、まだユーザインタフェース周りはマシだった説はある。

2018/09/02(Sun)

[自宅システム管理] チラシの裏

このチラシの裏は未だにに20世紀の遺物であるPerl5で書かれた そびクソ重厚長大な某WEB日記ツールを、後方互換切捨ての度に動かなくなるの無理矢理修正しつつ生成してるのよね、WikiブームやらBlogブームCMSブームやらなんやらが起きては死ぬ度に新しいツールに移行したいなぁと思いつつ早ピー年経過したわけですが以下略

もう平成も終わるので 駿河屋ですら恩赦するご時勢なので、Perl5捨てたいよね…

@閑話

駿河屋はあそこ客層がアニオタ中心なのでニーズにマッチしない中古洋楽CDが安かったのよね、なもんでアニオタではないワイでも時々利用してたんだけど、最近は他と変わらなくなってきてちょっとアレ。 それでも○ックオフみたいに長期間在庫を抱え込む気は無いようで入荷から時間が経つとどんどん値引きしていくのでタイミングによっては安い。

いっぽう○ックオフだとまず基本的に定価ベースで中古価格を決定するのでまだCDが3000円とかした時代の定価の1/3とかつけるのがデフォなんよな。 よって同じ内容のCDが廉価1000円シリーズで再発されてたりすると、新品より中古の方が高いみたいなことが日常茶飯事、なので売れずに長期在庫になってるのがオンライン店舗の在庫子状況でも丸判りなのよな。

希少盤コレクターならその値段でも買う可能性はあるかもしれないけど、そういう客層はオビの有無とか商品状態の有無も書いてない○ックオフオンラインには手を出さんのよね。 それに希少盤となると定価だけでなくアマゾンのマケプレ出品価格も参考にしてるようで、業者BOTが異常に吊上げた値段ベースで価格が決定されるので、コレクターでも絶対買わんわという値段になっちゃうのよねアレ。

あそこ以前どっかで読んだ経営陣のインタビューで「ビッグデータ活用すれば商品知識は不要、値付けはバイトに端末叩かせて人材コスト圧縮」とかいってたんだんだよな。

異常値は異常値であるとか見抜ける人でないと(データ分析は)難しい。

そりゃ中古屋に必要な目利きの技能を持った人材抜きでビッグデータごっこしてれば経営傾くのは残当といえる、南無南無。

@閑話休題

今時なら記法はMarkdownにでもしときゃ汎用性あるやろという事で、某WEB日記ツール記法で書かれた大量のチラシの裏の妄言を変換するツールを、ブロックレベル要素とかインライン要素とかを記憶の底から掘り起こしながら書いた。

最初はなんか勉強がてら新しい言語でも使うかーと思いつつ結局はPerl5で新規にコード書いてしまい、Perl5を本当に俺は捨てれるの怪しくなってきたゾ…

あとはMarkdownからHTMLにするのに

あたり導入すりゃええかなーという、まー新元号になるまでには移行できるやろ(震え声)。

軽量さでHexoの方が良さそうなんだけど、オレオレN6だとNode.jsのビルドに失敗する問題が以前からあって原因調べるのが面倒。

2018/09/03(Mon)

[自宅システム管理] チラシの裏(その2)

某WEB日記システム記法 → Markdown形式への変換コードはほぼ書けてるので、ローカル環境でHexo動かして体裁チェックしつつ細かな調整加えてるんだけど、なんせ運用開始当初のデータがWEB日記(死語)なもので「何年何月何日の日記」という体裁だから記事タイトルのつけかたがクッソ雑なので、今時のブログ風に記事一覧出すとさっぱり中身わからんのよなこれ。

あとこの某WEB日記システムにもカテゴリという概念はあったんだが、そこから記事一覧に飛べるみたいな機能が無かったので当初は付与してなかったのよね、途中から将来的なシステム移行を意識してつけはじめた後もネタに走リ過ぎてカテゴリー名リストアップしたら正直使い物にならんというか頭おかしいんじゃねェのこいつ状態、まぁボブ・ディランの歌詞に影響をうけてまともな文章が書けなくなってるから仕方ないね。

ということでカテゴリ分類やタグ付けはビックウェーブに乗って深層学習みたいな手段でどうにかするしかないか、正直ワイの頭じゃk-means法とNomeansnoの区別がつかないんですけどね。

うーん名曲だ…

そもそもワイの頭じゃ自然言語処理と自然薯の区別の時点で怪しいからな。

自然薯 → とろろ芋 → ネバネバ → メカブ → MeCab(形態素解析エンジン)

あってるんじゃねーか。

技術記事の場合、本文よりもむしろ引用やコードブロック内に注目して、プログラム言語や使ってるライブラリ名そして関数名なんかを解析して、そこから例えば国際化、ネットワーク、デバイスドライバみたいなタグ付けしたい、というのがいいんだろうけどなぁ。

まず手始めにmecabとmecab-ipadic-neologd辞書フルインストールしてみたが、さすがにプログラミング言語の関数名みたいな辞書は無いので、本文内で引用してるソースコードの部分は全く意味を成さない品詞の羅列になってしまうのよね。

ちょろっと調べた限りだけどプログラミング言語の仕様書を元にしたコーパスや辞書とか無さそうよね、自分でいちいち辞書を登録するのも手間かかるしそれならいっそ全記事読み返して手でタグ打ってく方がはやいという(なお精神が持たないもよう)。

そもそもコードブロックならコメント文以外は日本語どころか自然言語ですらないので、分かち書きの機能なんて要らんわけでmecabにやらせるのは完全に筋違いというのもある。

とりあえずシンタックスハイライト程度の精度とルーズさで構わないので、コードブロック中の言語判定と依存ライブラリそして使用関数名の統計をとるお手軽な方法ないんすかね。

言語判定なら例えば LinguistというGitHub社が作ってるライブラリはあるけどなぁ、そこから更に何の目的のプログラムか判定するような機能はさすがに無さそう。

最悪の場合 highlight.jsをNode.jsで動かしてシンタックスハイライト済のHTMLを生成し、そこからgetElementByClassName()で依存ライブラリや使用関数やら収集するって力技でもいいんだけどね…

でも結局のところはじゃあその依存ライブラリや使用関数がどのような技術に紐づいてるか、例えばiconvという関数名から文字コードとか国際化というキーワードを導き出すのはやっぱり辞書が必要なのよね…

つーかワイのかつてのワークエリアはクソ狭いので、全部の記事に「国際化」「文字コード」と打っておけば9割当たるので決めうちでおkという話もある。

2018/09/04(Tue)

[小説] Philip K. Dick/Confessions Of A Crap Artist(戦争が終り、世界の終りが始まった)

巨大台風の訪れで避難場所を求めたのか、巨大なアシダカグモが部屋に入り込んでしまった。

頭では益虫だと判ってはいるんだが、先日ちょうど映画「 遊星からの物体X」を観たばっかりだったせいで耐性が下がってたのよな。 この善良なエイリアンと同居するのはちょっと精神的に難しいので退去願うことにしたんだが、平和裏に物事は進まず結果として無益な殺生と相成ってしまった。 そろそろ三途の川の向こう側に渡った後の事を考えて、蓮池のほとりでブラブラしてるお釈迦さまの気まぐれな慈悲にワンチャン賭けんと極楽浄土ムリゲーなんだけどな。

映画では火炎放射器でクモのようなカニのような異形のエイリアンを焼き払ってたけど、こっちは殺虫剤はあくまで威嚇射撃として部屋から追い出し外界へ誘導するのが目的だったんだけどね。 息絶える瞬間に彼の沢山の眼がまるでLEDライトのようにギラギラ光っていたのは憎しみの眼差しだったんだろうか。 この前どっかで「 虫虫ゲッター」という捕虫器の存在を知って便利だなーと思ったんだが、その時ポチっておけば無益な殺生は避けられたな。

クモで思い出すのはP.K.ディックの小説「 Do Androids Dream of Electric Sheep?(アンドロイドは電気羊の夢を見るか?) 」に登場する模造動物修理業者のイジドアという男のことだ。

物語の終盤近くで彼は核戦争の結果自然界ではとっくに絶滅したと信じられていたクモを発見する。 彼は興奮しながらそのクモを小瓶に入れ部屋に持ち帰り、最近知り合いになったプリスという女に見せるのだけれど、彼女は全く興味を持たない。

それもそのはずで彼女はアンドロイドだった、イジドアすなわち人間がなぜクモなんかに興味を持つのかアンドロイドとの違いを確認するかのごとく、クモの足をハサミで一本一本切り落としていく。 イジドアは堪らず悲鳴を上げ足を失ったクモを奪い返し、これ以上苦しむことの無いように水で溺れさせ絶命させる。

アンドロイドが感情移入能力を持たないことは、物語の冒頭で主人公のデッカード警部がアンドイドと疑われる者に対して行われるフォークト=カンプフ検査で明らかにされる。 そしてプリスがこのイジドアに対して行ったクモの虐殺ショーはそのシーンとの対比であり、アンドロイドが人間を検査するシーンともいえる。

このイジドアという男の原型はディックの初期の作品である「 Confessions Of A Crap Artist(戦争が終り、世界の終りが始まった) 」にも登場する。

つまらないことで仕事を失い、地球空洞説なんかのニセ科学やオカルトを熱心に収集するうちにUFO教団に入信し世界終末論に染まってしまう男で、いわばディック本人の自伝である。

実は「電気羊~」という作品世界、核戦争後の放射能の死の灰が降りしきる世界というのは、UFO教団の予言からイジドア=ディックが妄想した終末世界ではなかったのだろうか、そして予言は外れそんな世界はどこにも存在しなかった。

しかし「 The Man In The High Castle(高い城の男)」の作品内小説である「イナゴ身重く横たわる」で書かれたように、現実とフィクションどちらが正しいのかというのは薄氷を踏むようなもので、ふとした瞬間に両者は入れ替わってしまう。

「電気羊~」はディックの作品としてはちゃんとSFしててプロットの混乱も少なくロマンスもあり、だからこそ「 Blade Runner」という映像作品に仕上がったわけだけど、この両作品を合わせて読むといつものディック作品のどちらが本当の世界か判らない「現実崩壊感」がそこにはあるわけだ。

映画の方は重要な原作要素カットしまくりで文句もあるんだが、まぁ別物と思ってみれば名作だよね、Vangelisの音楽すこ。

なお「 Blade Runner 2049」は周りで面白いという評判を全くきかなかったので観ないまま劇場公開期間過ぎてたもよう、意外と点数高いのねぇ…

自分はそもそもSFファンではない(ガジェットSF嫌い)、というかこのディックの「現実崩壊感」が好きで読んでるんだな。

ところで「戦争が終り~」は長らく絶版だったけど、最近新訳でたようで。 タイトルが中途半端に原題によせて「ジャック・イジドアの告白」となったもよう、Crap Artistの訳に困ったかな。

まー 例のアレが翻訳でないのはいいことだ、ヴァリス三部作も創元に返して大瀧啓裕訳と藤野一友表紙を復刊して欲しいですね(ぉ

2018/09/05(Wed)

[写真] Vuescanでスキャナーが認識しない時にまず確認すべきこと

何度か紹介してるような気がするスキャナソフトの Vuescanなんだけど、Windows版のインストーラーには国際化がらみのバグがあって、環境によっては正常にインストールできたように見えても動作しないことがある。

というのも、アプリケーションのインストールに続けてドライバのインストールを実行する際に、一時ディレクトリにドライバファイルを展開するのだけれど、この一時ディレクトリのパス文字に非ASCIIな文字が含まれてると、ドライバーのインストールに失敗する上にエラーメッセージが表示されない。

本来は以下のドライバインストール画面が出るはずなんだけどね。

よってこの状態になってしまうとアプリケーションは起動するんだけどドライバーはインストールされていないので、スキャナーが見つかりませんでうんともすんとも言わなくなってしまう。

ドライバインストールは%SYSTEMROOT%\setupapi.dev.logにログが残るはずなんだけど、何も記録されていないのでWindows側(dpinst or pnputil)の問題ではなく、インストーラーがマルチバイト文字に対応してないAPI呼んでしまって、一時ディレクトリのドライバの場所を開くのに失敗してるんだろうね、なんか20年くらいタイムスリップした気分なんやな。

なもんで、ユーザ名に日本語なんかの非ASCII文字を含めている人はほぼ確実にこのバグを踏んでしまう、というのも最近のWindowsにおいてはセキュリティの為にユーザ毎に一時ディレクトリが用意されているから。

C:\Users\日本語ユーザ名>echo %TEMP%
C:\Users\日本語ユーザ名\AppData\Local\Temp

回避するには一時ディレクトリを別の場所に変更するんだけど、これはセキュリティの問題が絡むのであまりお勧めはできないのよね、なのでVuescanのインストーラーを実行するときだけ一時的に変更するにとどめたほうがいい、なおVuescanの更新ってわりと頻繁に数週間単位で降ってくるので、めんどくさくなるもよう。

いちおうバグ報告済ではあるのでいつの日か直るかもしれんけど、まぁやっぱり今の時代でもユーザー名はASCII文字のみにするって自衛は必要よね、Adobe関連のソフトでも未だにトラブル頻発するしな…

[自宅システム管理] チラシの裏(その3)

前回からこれまで本能のおもむくまま書き散らかしてきたチラシの裏の技術系記事を、どうカテゴリ分類するかという話を書いてる(ほんとどうでもいい)。

まずぱっと思いつくのはNのmanなりTOGのUNIX(R) Specをコーパスとするところからはじめるんですかねという。 文章の論理フォーマットがきっちりしているし、物理フォーマットもroffとかhtmlみたいなパースに既存ライブラリが吐いて捨てるほどあるしな。 というか絶対俺がやらんでも誰か既に作って隠し持ってんだろけどさ。

そもそもmanなら関数名そして2ならsyscall、3ならuserland、9ならkernelという分類がすでにできてるし、SEE ALSOやSTANDARDみたいなのもあるわけで。 そしてUNIX(R)のSpecもXSH(System Interface & Headers Issue)みたいな分類あるし、章立てもしっかりしてるからシソーラス作るの役に立つような気はする。

なおどちらも英語なのでワイの日本語記事との相性はよくないもよう、manの日本語訳は百害あって一利なしとかいってた原理主義者が将来の芽を摘んだのである(ぉ

まぁそんな所からはじめるとなると、コーパスとかシソーラスがモビルスーツの名前かポケモンの名前かというくらい門外漢のワイの低スキルと相まって、平成の次の元号終わるナリくらいの時間かかりそう、はい不敬罪。

とてもじゃないけどやっとれんので、関数名をキーにセクション番号から類推されるプログラミング分類、そして準拠する規格を導き出すくらいの雑な辞書作って、それを元に記事にタグ付けして後は目視で手作業かのう。 そもそもワイのクソ記事にそこまでして何の得があるというのか(反語)。

2018/09/06(Thu)

[情報システム] 災害とディザスタリカバリとソーシャルメディア

東京あたりの企業ってディザスタリカバリ先に大阪あるいは北海道を選ぶのが定番だと思うんだけど、わずか2日の間に巨大台風と大地震でどっちも大変なことになってるので、実は日本国内だけで構築するのはRAID組むのに同一ロットのハードディスクを選ぶようなものなのかもしれない。 やっぱり日本にIT産業って不向きなのでは…

そういえばTwitterって2011年の東日本大震災の頃に「情報インフラ」「災害情報はTwitterで」みたいな持ち上げ方で人が増えレスバはじめやがった事で一気にオワコン化したけど、昨夜未明の北海道の大地震で久しぶりにクライアント立ち上げてみたらその情報インフラ様、3ツイート毎にソシャゲ公式!アニメ公式!詐欺仮想通貨!出会いマッチングアプリ!ブラック人材派遣!とスマホ画面全面を覆うように改行入れまくったクソ広告ツイートを挟み込んできてまともな情報が埋もれて、災害情報どころじゃなくていかにこのSNSが醜く変質したかってのがよくわかりますな。 テレビの災害特別報道番組みたいにCMカットしてから情報インフラを名乗れイキんなクソが。

多分未だにあれにしがみついてる人はそもそも廃人で数千フォローとかでTLなんか最初から読める状態じゃないあるいは非公式クライアントで広告を消してるんだろうけど、フィルタリングを駆使する事に慣れると人はどんどん盲目になるので「都合の悪いことは見ない」という悪しき精神性に知らず染まるんだよな。 そもそもフォローすることで自分だけのタイムラインを作る時点で偏向が生まれるから、頭のおかしい人はよりおかしくなるんだろう。 アーリーアダプターともなると10年以上は続けていて、脳の老化もはじまって認知が衰えだす頃合でもあるわけで。

こういうのは2chなんかでも専用ブラウザのNG機能を長年駆使し続けてる廃人にも見られた現象なので、自分は多少不便でもその手のツールは使わない方がいいと思っている。

[自宅システム管理] CygwinでMeCabとCaboChaを使う

とりあえずCの関数名の辞書を作るならそれこそmanのroffを.Nmあたりでgrepすればそれっぽいもの作れるよな、それ使えばコードブロック中の言語判定は実装できるか。 本当はwhatis(1)とかapropos(1)がもうちょっと機能豊富ならええんやけどね、せっかくNのmakemandb(8)では後方互換捨ててまでSQLite database化したんだし。

そんで平行してCygwin+Perl環境でText::{MeCab,CaboCha}動かして遊ぼうと思ったんだが、ちょいちょいpatchが必要だったので転がしておく。

2018年現在にWindows Subsystem for Linuxも使わずCygwinでしかもPerlとかいろいろとヤバイのだけども、そろそろビンテージギターみたいに社会的に白眼視されないようなお洒落な名前をつける必要があるかもしれない。

2018/09/07(Fri)

[写真] Lomography Belair X 6-12

中判写真はじめた理由はレコードやCDのジャケットと同じ1:1フォーマット(いわゆるスクエア)な6x6がやりたかったからなんだけど、最近その表と裏ということで6x12な1:2フォーマットに興味がでてきた。

ただこいつは普通の中判カメラでは撮影できず4x5の大判カメラにそれ用のバックをつけるか、 Technorama 612pc IIとか Horseman SW612を一式ン百万コースで買うしかないので、敷居じゃなくてハードル高くて来世に期待しようレベルなんやな。

ところがPlaubel makina67とかMamiya6、FUJI GF670みたいな蛇腹式中判カメラで6x12撮影できるやつがあったのね、知らんかった。

ただLomographyブランド察する通り、2.5万というお値段通りの性能のトイカメラちゅー感じで、レンズはプラで画質はお察し蛇腹は光線漏れまくりとのことでドイヒー。

改造するにしても50mmくらいで6x12カバーするレンズとかイメージサークルの大きい引伸し用レンズでもあるかどうかってとこだしな、つーかプラレンズならピンホールの方がよっぽどマシやんやな。

なので大貧民が中判で1:2するならMamiya RB67に Graflex "23" GraphicあるいはRH-8とか Mamiya Press用の6x9バックつけて、撮影後に上下トリミングして4.5x9にするのが関の山かねやっぱり、ただRB67は広角側がフルサイズ(笑)換算28mm相当の50mmまでのレンズしか無いのでイマイチなんよね。

2018/09/08(Sat)

[写真] Vuescanのインストーラーバグの解析

先日の件、どうせしょーもないバグやろとWingDbg使うまでもないProcess Moniterでじゅうぶんやとってトレースとったけどやっぱりしょうもないバグやった、つーかProcess Monitorもフィルタ周りバグってないかこれ… まぁ即CSVに変換してgrepしたからどうでもいいんだけど。

これね。

$ LANG=ja_JP.UTF-8; export LANG
$ echo 日本語ユーザ名 | /usr/pkg/bin/iconv -f Windows-31J -t UTF-8//IGNORE
譌・譛ャ隱槭Θ繝シ繧カ蜷

と同じ壊れ方してるやね、文字の化け方ですぐピンとくるやつ。

要するにGetEnvironmentVariableあたりからとってきたであろうTEMP環境変数、これの文字コードはMS932(Windows-31J)なんだけど、CreateProcessWあたりのワイド文字系APIを使ってpnputil.exeを起動するのに、UTF-8と決め打ちして変換してるっぽい。MultibyteToWideCharをCP_ACPでなっくCP_UTF8とかそんな感じなんだろう。

報告はしたけど直せるかは知らない、クローズドコードだからこここう直せとか指示できねーしな。

[写真] 続・Vuescanのインストーラーバグの解析

前記事のやつバグレポの回答が来て、内部でパス名は全部UTF-8で管理してるんだけどW系の関数呼ぶのにMultiByteToWideChar(CP_ACP)使ってたせいで化けてたわCP_UTF8に変えるわ、だそうで。

これで一件落着なんだが、CSI残党としてはちーがーうーだーろーと突然暴れだす患者(画像略)

でも今のWindowsってNTFSがUnicodeなのはまだしも、ユーザー名すらもUnicodeで管理されてるので、日本語版ならShift_JIS(Windows-31J)に存在しない文字入りのユーザ名すら容易にに作れる(それこそ絵文字すら可能)。 なもんでCSIつまりWindowsだとCP_ACP(ANSIコードページ)なアプリ作成してしまうと自分のホームディレクトリ以下にすらアクセスできないゴミになる恐怖、なので内部Unicodeにせざるをえない。

やっぱりユーザー名くらいはPortable Character Set縛りにすべきよね、日本語名は表示名として別途持てばいいわけでさ。 まぁもはや手遅れで文明が滅んでまた一からコンピューターが作られる時までノーチャンスだし、ポストアポカリプスに生きる人々へ伝えるため石版彫って後世に残すのがせめてもの作業ですが。

つーかズラウスキの映画「 シルバー・グローブ/銀の惑星」みたいに遠くの惑星に移住した宇宙飛行士の子孫がつくる原始文明に、カーゴ・カルトの神として降臨しCSIを伝授すればいいのか。

2018/09/09(Sun)

[自宅システム管理] チラシの裏(その4)

しばらく前から邪悪(新)とか邪悪(旧)とか邪悪(その他)な会社どもがJavaScriptライブラリやらWEBフォントをCDN経由で無償提供してるけど、あれも結局誰がどういうページを閲覧してるのかの行動監視目的として提供してるもんで、タダより高いものは無いというやつよね。

チラシの裏リニューアルでブログのテンプレート的なものを眺めてるんだが、だいたいあの手のサービス使っていてクソ萎えるんですが、WEBデザイナー業界の人たちはその辺のカラクリを理解して加担しているのか、ただなんとなく流行で使ってるのかどっちなんですかね…

そもそも自分のウェッブサイトであの手のもの使うとなると、欧州であればGDPR(EU一般データ保護規則)的には説明義務生じる級のものなんじゃねーのと思うけどどうなんすかね。 もちろんtwitterやらyoutubeやらの埋込もそう、これじゃタマネギとどちらがダークウェブなのやら、もはやインターネットは日没し覗き魔が闊歩してるのである。

RMSくらいのパラノイアになると、自身のプライバシー保護に匿名のクローラーで収集してからオフラインで見ると聞いたような記憶がある。

2018/09/10(Mon)

[自宅システム管理] チラシの裏(その5)

過去記事のAAがズレてたのが気になって(パラノイア)、懐かしのモナーフォントをWebFont化とか誰かやってないかか探したんだけど、最近のモナーフォントってIPAフォントベースになってるので、派生フォントの再配布に関する制限事項をWebFontの場合はどう満たせばいいのか問題あるんやね、CSSに改変前のIPAフォントへのリンク書くだけいいみたいな運用してる人いるけど、ほんとにそれでライセンス条項満たせてるんだろうか…

つーかIPAフォントが単体配布や再配布が可能になり改変もOKになってたこと自体知りませんでしたわ、なんせNの場合だとXLFDで管理できるX-TTからそびクソXML地獄になったXft以降のX-Windowでフォント管理とかやる気にならんので、ビットマップフォント以外使わなくなったしそれにN自体以下略

そういえばXftはフォント周りのクライアントサーバモデルを批判してそれを捨てたわけだけど、結局またWebFontみたいなものが流行ってるわけでなんだかなーという気分になる。

インプットメソッド周りでも同じこと思ったんだよな、同じ頃にAnthyやらGTK+やQtやらでクラサバモデルは時代遅れだと批判されてた記憶、しかしそれでユーザは便利になったかつーと結局のところ安易なモジュール化によりC++やpthread絡みのABI非互換性を踏みまくって阿鼻叫喚だったわけでな。

それからしばらく後、Mozc/Google日本語入力が登場しクラサバモデルだからこその安全性堅牢性みたいな記事がでてきて、過去クラサバ批判に同調してた人々がテノヒラクルーしたとき、やっぱりなんだかなーと思いました、まる。

まぁでもクラサバモデルでサーバ管理者、今ならクラウドの中の人間が利用統計をどんなことに使ってるか判らない覗き見の恐ろしさってのはいま一度批判されるべきだわな。

2018/09/11(Tue)

[オープンソースライセンス] IPAフォントライセンス

昨日の続き、CSSに注意書きすればいいどころの問題じゃなくて IPAモナーフォントの最終リリースは2008/04/27なので、その時点でのIPAフォントライセンスは

というかなり抜け道的なやり方でのリリースだったので、WebFont化して使うには最新版をベースにし直さない限り無理よねこれ。 過去のリリースにまで遡及して適用とはIPAフォントライセンスには書いてないし。

なので実質パブドメと書いてある モナーフォントを使うかだな、ビットマップの東雲フォントベースとしか書いてなくて、アウトラインをどう生成したのか不安だったのだけども、README読むと東風フォントだったのを例の事件の後に東風フォント代用品(現さざなみフォント)に差し替えたとある。

そうするとライセンスとしてはパブドメではなく東風フォント代用品が準ずる和田研ライセンス(さざなみフォントは許可を得て修正BSDLに変更)でありこれもまた再配布について制限があるんだけど、今調べたら 撤廃されてるのね、じゃぁこれでいいか。

海外の人がAA見るのにすでにmonafontを軽量化してWebFont化した submonaというのがあったのでこれで十分か。

ところでIPAフォントライセンスの経緯を読んでると、IPAフォントの利用範囲が不明確だった時期に「(オープンソフトウェア活用基盤整備事業の成果物である)同梱ソフトウェア以外からの使用は問題ないのではないか」と回答した某、あそこ以前仕事で絡んだ時にGPL3を採用するかクローズドにしたきゃ商用ライセンス買えのデュアルライセンスな Sencha ExtJSを「LGPLだから問題ないです」といって納品してきてエライ目に合った事があるので、実はこの時もIPAに確認せずフライング回答してたのでは感がある。 下手するとこれ東風フォント問題みたいになってたバッドエンディングルートありえたんじゃねーかなこれ(適当)。

ちなみに余談だけど、Sencha社は ライセンス違反サイトを検知するため利用統計を取るためExt JSに自社の管理するサーバに置かれた1x1ピクセルの画像ファイルへのリンクが混入されているのでライブラリの中身をちゃんと読んでない開発者が公開サーバにデプロイすると即バレする。 もしかするとワイ気づかなければSencha法務がこんにちは!しにきたのかもしれん、営業経由で某にゴルァしたらベトナムの研修生が作って本人すでに退社済みと地方の農家かよな言い訳以下略、商用ライセンスたいした値段ではないので予算下りて助かりましたよ。

そもそもバグだらけでまともに動かんからほとんど書き直す羽目になったので、Ext JS使わずに済むよう GeoExt使うのやめて直接 OpenLayers使えば2-clause BSDLで安心だったんだけどね。

つーかExt JSは3から4は内部完全に書き直されてて非互換だから3がEOLになると更新にはソースの大修正が必要になって死ぬ、まぁどうせ今頃放置されてる事だろうナムナム。

2018/09/12(Wed)

[セキュリティ] 続々・Meltdown/Spectre

そういや6月末くらいにHaswellの載ったDELL Optiplex 3020SFFに INTEL-SA-00155つまりSpectre Variant 3a( CVE-2018-3640)とVariant 4( CVE-2018-3639)対策マイクロコードの入ったUFEIアップデート(A18)が降ってきてて、 前回(A15→A17)および 前々回(A15→A16)と同様にベンチ取ったのを忘れていた。

今回も雑にまとめると

ちゅー感じでこれなら導入してもええわってレベルにようやく落ち着いたな、ようやっとる(中日白井オーナーが森監督を評して)。

2018/09/13(Thu)

[Mobile Phone] Xs MAX

寝落ちしてて目が覚めたらiPhone SEが消滅してるわWindows Updateで再起動かかって書きかけのもろもろ消えてるわで怒りがXs MAX(クソ マックス)なんだよなぁ。

そういやキャリアからGoogle Pixelようやく出るという噂だけどこっちも今更感しか無いわな。

[オープンソースライセンス] 続・IPAフォントライセンス

続き、最近の5ch(旧2ch)もスマホが主流になりAAがまともに表示されないから、投稿内容中の全角スペースだかで判断してspan class=AAがついたレスにはWebFont使われてるのね、へぇ。

指定されてるMona.woffのアウトライン確認したけどIPAモナーフォントではなく旧モナーフォントからの変換やね。 ワイと同じくIPAモナーフォントはIPAフォントライセンスv1.0以前をベースにしてるからWebFont化しての再配布は禁止という判断やろな。

あれおそらくFontForgeあたりでMSPゴの幅合わせて手動で調整だろうから、再配布可能にする為には一から作業やり直しレベルになるんすかね。 それならIPAから過去のバージョンに遡及してライセンス適用するという言質とる方が楽そうではあるが、はっきりいってどうでもいい。

他に東風フォント代用品の派生である「 戸越フォント」にもMSPゴの幅に合わせた書体があるみたい、こちらも和田研ライセンス継承なので マサカリ担いだDebianにFOSSでないと指摘されてる旨がプロジェクトページや WikiPediaの記事にまで書かれてるけど、前回も書いたように和田研ライセンスの制限事項は 撤廃されてるのでWebFontとして使うのは問題ないやな。

ちなみに2chで好きなAAはこれでしたね、確かクアッドもあったよな…

           `ゝ 
 ドッキング    _//´ 
       / :;/' 
     _/@,;)ゞ 
  _/;@/ ̄ 
  /",:;ン   にぼし 
__/,/ 
`V 

あそこはとっくの昔に統失の妄想と偏執を増幅する装置でしかないし、今ではインターネット全体がそうともいえる。

2018/09/14(Fri)

[自宅システム管理] チラシの裏(その6くらい?)

いつになればgensimまで辿り着くのかword2vecで遊ぶまでの前準備ですらめんどくさいもうヤダ *1

まず学習用のコーパスの作成と分ち書きの精度を上げる辞書が必要になるんだけど、検索汚染するだけのやってみた(だけ)記事での使用例が多いジャアアア日本語Wiki PedoPediaの全文データじゃアニメと声優そしてAV女優ばかり学習してしまうので、そこは日本語マニュアルを使って学習ですかねというのが前回まで。

日本語マニュアルについては、N方面は翻訳と口にしただけでアンチが西武打線ばりに山賊襲来して絶命するとの噂だけど詳しい事は知らん。 pkgsrc/misc/ja-manによれば最新版はNetBSD1.3I-jman-19990531でほぼ20年前。 しかもセクション3の翻訳状況は無し・零・絶無・皆無・ナッシング・ゼロ・死んだオウム以下略。 さすが使ってる人間みなlogin:が表示されたらそこで押入にしまうというだけはある、やはりワイは間違った側の空を10年飛んでいたわけですわ。

そんでFの方も ports/japanese/man-docにある最新版はman-doc-5.4.20050911でこちらも干支軽く一回転状態だし、セクション3の翻訳状況も芳しくない。

なので結局頼るのは戦いは数だよ!の言葉通り JM Projectすな、こちらは最新リリースはman-pages-ja-20180815でセクション3もようやっとる。 来世では「大松曰、寧為牛後、無為鶏後(大松「鶏の尾羽よりも牛の尻尾の方がマシだぞ」)」をモットーに生きよう、なお今生はまにあわんもよう。

これで足りないようならどーせコーパスと辞書は公開目的じゃないし商用UNIXのマニュアル関連食わせるでええかね。

んでroff形式のマニュアル整形するのにGNU troff(groff)なりmandoc(旧mandocml)に食わせる前に

あたりは取り除いておいた方がええのでスクリプト書かんとなという、あと同時にMeCabで分ち書きする時に例えばstrtok_rが

$ echo strtok_r | mecab -Owakati -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
strtok _ r
EOS

のように分割されてしまうのを避けるために辞書にせんとならんのだけど、これはNの場合マクロ使って

.Nm strtok_r

とこれは名前だよという意味が持たせてるんだけど、JMだと文中の

\fBstrtok_r\fP()

のような太字指示である\fB~\fPの間がおそらく関数名だろう(イタリックなら変数名)くらいしか判らんのがちょっとアレ。 まぁ関数名辞書は別にNのマニュアル原文の英文からも作れるしいいか…

そういえば分ち書きの辞書として mecab-ipadic-NEologdってやつがネットに強い 辞書というので導入してあるんだが

$ echo 常考 | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
常考    名詞,固有名詞,一般,*,*,*,常考,ジョウコウ,ジョウコー
EOS

とあるけど「常識的に」「考えて」にはならんかさすがに。

それはそうとして

$ echo 33-3 | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
33      名詞,数,*,*,*,*,*
-3      名詞,固有名詞,一般,*,*,*,-3,マイナスサン,マイナスサン
EOS

せやね、じゃあ

$ echo 33-4 | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
33-4    名詞,固有名詞,一般,*,*,*,33-4,サンジュウサンタイヨン,サンジュウサンタイヨン
EOS

はい、皆さんご一緒に

$ echo な阪関無 | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
な      助詞,終助詞,*,*,*,*,な,ナ,ナ
阪      名詞,固有名詞,人名,姓,*,*,阪,バン,バン
関      名詞,接尾,一般,*,*,*,関,セキ,セキ
無      助動詞,*,*,*,形容詞・イ段,ガル接続,無い,ナ,ナ
EOS
*1:これが終わったらスキャンした大量の写真の整理にOpenCVをだな…

2018/09/22(Sat)

[やきう] 加賀・後藤引退試合

もう8月からまったく試合観てない結果も順位もチェックしてなかったんだけど、引退試合だったので久しぶりに。

加賀引退試合のバレンティンからのビデオメッセージも良かったけど、菊地が安定のガンプラと共に登場し大草原、生きとったんかワレェ!

そんで翌日の後藤引退試合、小池の2HRみたいにまだやれる感はゼロでヘロヘロの空振り三振やったけど、横浜高校バンドオブブラザーズっぷりが泣けましたな。 花束贈呈が終わって中日他の選手が全員ベンチ裏に下がった後も松坂と小山がパレードする後藤を見つめ、松坂は胴上げにも加わったのは本当に感謝やね。 そいや渡辺監督も観客席おったそうで、なお渡辺孫ドラフト以下略

去年の高崎大原小杉下園も横須賀でなくハマスタで引退試合してやりたかったよね、TBSベイスの犠牲者も残り少なくなってきたもんだ。

あとは28日の東京ドームで村田の引退セレモニーやな、多村が中日の育成クビになったあとソフトバンク有志が引退セレモニーやってくれたようなやつだと思うけど。

2018/09/24(Mon)

横浜駅西口

ほぉーんダイエーも年内で閉店になるんやね。白塗りの老娼婦メリーさんやアリック日進に旧東急ハンズやCIALそして不法占拠の屋台なんかと同じように記憶の中にしかない風景となるわけだ。

まぁ東日本大震災であの一帯は液状化で結構な被害出て建て直したビルもあったのに、ろくな補強せずに営業継続しとったし残当、あちこちガタガタで次の震災で居たくない場所で打順組んだら堂々の4番やったしな。

あおい書店(現ブックファースト)が入居した時の品揃えはもう八重洲ブックセンター行く用事も無くなるわとガッツポしたんだが、そこは民度の怖ろしく低い横浜なので商売になるはずもなくあっという間に規模縮小で役にたたんようになったな、このままどっか移転せずに撤退やろうか。

あと近くの畳屋3Fから移転してきたレコファンやけど、賃料安いのか4F全面使って営業しとったけど移転するなら規模縮小やろうね。しばらく前から1枚100円のピンクシールはじめたのは移転前の在庫整理だったちゅーことか。 移転先どうするかは知らんけど、これまで通りの広い売り場面積と深夜営業23:00まではまず無理やろうし賃料アップ分は価格転嫁やろうから、渋谷BEAMS店みたいにまるで魅力のない店になりそうやね…

2018/09/26(Wed)

[Mobile Phone] iOS12

iOS12になってからSafariがJS使ってDOMに要素追加してくようなページだと頻繁にクラッシュして

a problem occurred with this webpage so it was reloaded

と表示されるばかりで使い物にならんな。

リリース翌日にはCSSでbackdrop-filterみたいな重いエフェクトとdivのネストを喰わせることでで簡単にOSごと落とす20年前レベルのブラクラまで 出回っとるし、もうAppleあかんかそうかとっくに知ってた。

iOSでもChromeやFirefoxもあるんだけどあいつらアフィの親玉そして出歯亀野郎だから広告・追跡ブロック使えねぇからな。

そういえばNexus5の電源スイッチはとっくに海外業者から届いてるんだけど、あまりの小ささに半田付けは諦めたゾ、さすがに表面実装用の温調付ヒートガン買うなら新しいスマホ買いますわな、とはいえ500円くらいで売ってるガスライター式の中華製ヒートガンだと失敗しそうだしねぇ…

2018/09/28(Fri)

[やきう] 引退打線

東京ドームの村田引退セレモニー、 4522敗の記憶の村田インタビューを読んだ人であればフロントの「5年で優勝するチームを作る」との引止めを待てなかったからFAしたという経緯を知ってるだろうけど、9年間の横浜時代でチームを強くできなかった事に村田が謝罪までしたのは心苦しいやね。背番号25を継ぐ筒香そして岡本からの花束贈呈も良かった。

横浜は今年村田獲っておくべきだったんよな、5年で優勝どころか7年やっても広島以外ボロボロのセ・リーグですら3位に滑り込むのがやっとじゃあ村田の選択が100%正しかったわけやしな、それにロぺス怪我離脱でファースト空いてる時期もあったわけで、まぁGMがアレのままじゃ優勝は2036年まで無理やろな。

そして岩瀬1000登板は同期の福留抑えての407セーブ目というのもストーリーやね、ようやっとる。