4.MeCabインストール to python

 

初心者あるあるだとは思うのだが、そもそもパッケージのインストールでめちゃめちゃエラー出る。

 

今回は前回話したMeCabのインストールについて。

 

と言ってもMeCabのインストール自体は難しくなかった

 

$brew install mecab

 

で一発。

 

 

ただこの後mecabpython用モジュールのインストールがだるすぎた。てかだるくはなかったんだけど、良く分からなかった。

 

 

結構な数のサイトをとんだのだが結局そのページが古かったり参照にしたWebページが存在してなかったりしたので。。。

 

結論から言うと、

 

$sudo pip install mecab-python

 

でこれも一発。

 

 

python3の人はmecab-python3にしないといけないとかあるのかもしれないけど。

 

 

とりあえずこれで何とかなった。

良くわかってないところ勉強せな。。。

 

$ python setup.py build

$ sudo ln -s /usr/local/bin/mecab-config /usr/bin/mecab-config

$ sudo python setup.py install

 

こういうコマンドもあるよう。

http://progmemo114.hatenablog.com/entry/2016/07/02/145015

 

分からんかったからすっ飛ばしたけど、あとで見とかないと。あとbrewって結局何なのかとか。

 

だいぶ初歩的だけど分からんまま使ってたし。

Macに早く慣れたい。。。

 

 

とりあえず今回はpythonmecabをつっこめたところで終わり

3.プロセスの確認

今日は目標達成のためのプロセスの確認をする。

 

大目標は何だったかというと、あれだ。

 

各大学のミスコングランプリを、twitterを使った形態素解析で予想しよう!ってやつだった。

Rだと何となくイメージつくんだけど、python分からな過ぎて混乱しそうなので備忘録的な回。

 

大まかな流れとしては

 

  1. Tweepyインストール←done
  2. ミスコン出場者の名前で絞り、その名前の含まれるツイートを収集
  3. MeCabインストー
  4. 収集したツイートをMeCabで切る
  5. それぞれの単語に対し、単語感情極性対応表からベクトル値を算出
  6. スコアの高かった人の勝ち!!

 

という流れかな。

 

必要なのはまずMeCabと単語感情極性対応表だけど、numpyも必要なのか?

 

numpyとRは似てるって聞いてからなにかとnumpyを使おうとしがちなんだけど、如何せんまだ何も把握していないので、使う場面はよもや使い方すら分からないから調べないとな。

 

細かいベクトル値とか条件、制約に関しては追々決めるとして、単語に対するベクトル値の紐付けとか、そもそも収集したツイートをどうMeCabで切るのか、そしてどう単語感情極性対応表と結び付けるかも決めとかないと。

 

データフレームみたいなのになれれば楽なんだけど、それはR的な考え方で、そもそもpythonだとデータフレームに格納しなくてもそんなの勝手にやってくれちゃうような何かがあるのか、それを調べなきゃいけないな、うん。

 

まずはMeCabpythonでの切り方を調べて、それぞれの単語ごとのまとめかたとかを確認するか。(前途多難)

2.圧倒的初心者

こういうプログラミング関連のサイトは無限にあるけど、初心者がやるやつって少なく、ちょっと楽しいことやってみたいけどサイトに書いてあるプログラミングのやり方とかはどこか専門用語が多くて分からないみたいな状況が多々あると思うので、そういう人たち向けになれば。

ちょいちょい用語の説明は省くかもしれませんが。笑

 

まずはじめに、tweepyのインストール。

え、tweepyってなんだって?

よくぞ聞いてくれた。

 

俺もよく分からない。

 

ただ前にRでtwitterRというライブラリを使ったことがあって、それに近い感じかなとふんでいる。

 

俺が思ってるのはpythontwitterをつなぐためのケーブルになってくれるようなやつ。tweepyを使えばpythonからデータをとれるし、ターミナルからツイートだってできる。

 

まぁ、ターミナルからツイートするくらいならTwitter開いてツイートしろよって感じだけどね、ハハッ。

でもbotとかには向いてるぽい。

 

 

でそのtweepyのインストール。問題発生。

これは初心者であることが原因な訳ではないと信じている。

 

Mac OS Sierraを使用。Pythonはバージョン2.7.10が標準装備されており、このバージョンではpipというパッケージ管理システムもデフォルトで入っているよう。

 

そしてコマンド sudo pip install tweepyを打ち込む。これでTweepyは問題なくインストールされる

 

 

はずだった。

なぜか突然のエラー。とりあえずエラーの内容をコピペしとく。(コマンド貼り付けが分からない)

 

 

Installing collected packages: six, oauthlib, requests-oauthlib, tweepy

Found existing installation: six 1.4.1

    DEPRECATION: Uninstalling a distutils installed project (six) has been deprecated and will be removed in a future version. This is due to the fact that uninstalling a distutils project will only partially uninstall the project.

    Uninstalling six-1.4.1:

Exception:

Traceback (most recent call last):

  File "/Library/Python/2.7/site-packages/pip/basecommand.py", line 215, in main

    status = self.run(options, args)

  File "/Library/Python/2.7/site-packages/pip/commands/install.py", line 342, in run

    prefix=options.prefix_path,

  File "/Library/Python/2.7/site-packages/pip/req/req_set.py", line 778, in install

    requirement.uninstall(auto_confirm=True)

  File "/Library/Python/2.7/site-packages/pip/req/req_install.py", line 754, in uninstall

    paths_to_remove.remove(auto_confirm)

  File "/Library/Python/2.7/site-packages/pip/req/req_uninstall.py", line 115, in remove

    renames(path, new_path)

  File "/Library/Python/2.7/site-packages/pip/utils/__init__.py", line 267, in renames

    shutil.move(old, new)

  File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/shutil.py", line 302, in move

    copy2(src, real_dst)

  File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/shutil.py", line 131, in copy2

    copystat(src, dst)

  File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/shutil.py", line 103, in copystat

    os.chflags(dst, st.st_flags)

OSError: [Errno 1] Operation not permitted: '/var/folders/zw/1n4qgzb54r9370s6ds23bx_c0000gn/T/pip-_xy5GJ-uninstall/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/six-1.4.1-py2.7.egg-info'

 

 

わりとめっちゃ謎だった。

 

調べるとpythonのパスが通っていないんやない?みたいな話を見つける。元からインストールされてるのにパス通ってないってなに?と思いながら打つ。

 

which python

/usr/bin/python

 

うーんなんかだめなんか?と思い調べると、ここにpythonがあるのは良くないらしい?

http://walkingmask.hatenablog.com/entry/2015/11/16/224638

 

でhomebrewでpythonを入れ直したのだがあまり変化はない。初心者なので良く分からない。

 

 

さすがにこれじゃないだろうと思い違うのを調べ始める。

すると発見!

 

Installing collected packages: six, oauthlib, requests-oauthlib, tweepy

Found existing installation: six 1.4.1

    DEPRECATION: Uninstalling a distutils installed project (six) has been deprecated and will be removed in a future version. This is due to the fact that uninstalling a distutils project will only partially uninstall the project.

    Uninstalling six-1.4.1:

 

この部分が問題らしい。

どうやらsix がすでに入っているせいで良く分からんことになってるよう。

以下参考URL

http://qiita.com/kawashinji/items/98fd8a917a17c3476091

 

これを踏まえたうえでもう一度コマンドを打ち込む。

エラーが出たコマンドは

sudo pip install tweepy

だったが、今回は

$ sudo pip install tweepy --upgrade --ignore-installed six

 

Installing collected packages: six, oauthlib, urllib3, idna, certifi, chardet, requests, requests-oauthlib, tweepy

  Running setup.py install for oauthlib ... done

Successfully installed certifi-2017.4.17 chardet-3.0.4 idna-2.5 oauthlib-2.0.2 requests-2.18.1 requests-oauthlib-0.8.0 six-1.10.0 tweepy-3.5.0 urllib3-1.21.1

 

見事成功!これでtweepyを使えるようになった。

とりあえず今回はtweepyをインストールするだけで疲れたので、ここまでにしようと思います。

 

 

 

 

 

 

 

 

1.ゆる目標

これからの目標は、

 

 

プログラミングをやってみる

 

 

ただそれだけである。

 

 

具体的にはまず、各大学で始められているミスコン。

それらに狙いを定め、twitterの情報から誰が一位になるかを予測する。

 

 

 

そんな感じで面白くできたら良い。(前途多難)

 

 

 

プログラミングはほぼ初心者なので、初心者に分かるようなものを書ければと思う(前途多難)

 

 

 

では

4.雪国(激熱)

 

久しぶりに投稿。

 

雪国(激熱)のp.a.r.a.d.o.x.感。

 

いや嵐の曲か。 

 

卒論のテーマ決めの時期で、何となく煮詰まっている。

 

理工系でこの時期にテーマが決まってないっていうのは、わりと珍しいとは思うんだけど、専攻的に実験がない学科だし、特にヤバいって感じではないわけだけど。

 

それでも何となく、果たしてあと四か月で書き終わるの感はあるよね、うん。

 

 

前回から日が空いたので、最後に言っていたのとは違う話をふと思いついたのでしようかなと。

 

 

f:id:sakigakeman:20161001194147j:plain

 

この画像どうやって真ん中持ってくんだくそっ

 

これは川端康成の『雪国』のただの一文なわけだけど、これを友達から教えてもらった僕の反応。

 

「深い…深すぎる……あえてのうーーんとか出来ないレベルや…」

 

とこんな感じ。

 

なつかしい。まことに懐かしい。

小学生のときの好きとかってそうだよねたぶん

 

 

最近の小学生は進化しすぎてるって聞くから分からないけど、僕が小学生の時は友達に「~のこと好きなんだー」とか言うことはあっても、本人に直接言うことはめったにない。ってかほぼなかったもんなぁ。

 

 

 

この話に関連してだけど、この前研究室の飲み会にて聞いた、教授が大阪の学会後に行った居酒屋に書かれていた張り紙についての話。

 

その張り紙には、各年代の女性から見た男性のタイプについて書かれていたらしいんだけど、それがわりと的を得ていたらしい。

 

  • 10代 不良っぽい人
  • 20代 面白い人
  • 30代 お金持ちな人
  • 40代 自分に構ってくれる人
  • 50代 健康な人

らしい。

 

で、10代以下のところについては書かれてなかったので、話し合った結果

  • 小学生 足の速い人

 

となった。

うーーん、これも非常に的を得ている気がする。

 

そして、これは女性から見た男性のタイプなわけなので、せっかく研究室のほとんどは男なわけだし、男から見た女性のタイプも年代別に分けようとなり、話し合った結果が以下。

 

  • 10代 かわいい人
  • 20代 大人っぽい人
  • 30代 エロい人
  • 40代 カラダの相性があう人(教授談)
  • 50代 よく分からん

 

 

男しょーもねえwwwwwwwwwwwww

 

 

というわけで今回は、深い言葉に始まり浅い見解で終わりましたアディオス!

 

 

 

 

 

 

 

 

 

3.R

 

 

今回は統計ソフトRの話。

 

 

 

このソフトを扱うためにはRでプログラムを組んで実行しなきゃいけないんだけど、

 

そもそもプログラミングって、それこそPCが好きな人とかアプリを作る人とかは出来るけど、それ以外の人たちはそんなに出来ないってイメージ。

 

出来る必要もないしね。

 

 

 

 

でも近年ではネット社会と言われるようになるまでインターネットが普及したせいか、工学的技術の価値がかなり上がっているような気がする。それこそプログラミングとか、機械学習とか。

 

そんな時代の流れに乗ろうと思ったミーハーな僕は、ある企業でインターンをしていて、そこでは R,SQL,Pythonとかを使いながらデータ解析の仕事をしている。

 

 

 

僕もまだそれらの経験歴が深いわけではないけど、なにも知らないという人のために使用ソフトの一つ、Rについて紹介しようと思う。

 

全人類の知識の源によると、Rとはどうやら

 

f:id:sakigakeman:20160213132912p:plain

 

 

 

のことらしい。

 

でも読んだだけじゃさっぱり分からないだろうから(読めない)

ちょっと補足。ちなみに僕もいまいち何言ってるのか分からなかった。笑

 

 

あくまで僕の主観的イメージだけど、Rって一言で表すなら

 

 

『自動統計解析装置』

 

 

って感じかな。

 

 

データを打ち込んでコマンドを書けば結果が返ってくる。簡単に言えばただそれだけ。

 

いやいやでも難しいじゃんって言う人も多いかもしれないけど、それはコマンドを書くのが少し面倒なだけでそれ以外は特に難しくはないと思う。

 

 

 

飽きたからRの詳しい説明は省くけど、とりあえず何も知らない人でもそういうツールがあるってことは知っておいても損にはならないんじゃないかなーと。

 

 

次はCMか、TOEICか、鉄道の話。

 

 

 

2.サンフランシスコ

 

 

 

 

つい昨日、録画されていた『魔女の宅急便』を観た。

 

別に観るのが初めてというわけではなくて、たまたまなんだけど。

 

 

 

ふと観たシーンはキキが新しい街の地図を広げながら届け物を届けに行くところで、

その地図を観た自分は

 

「サンフランシスコの地図に似てるな。」

 

と思った。

 

 

f:id:sakigakeman:20160213000036j:plain

 

 

 

昔から母親が教育熱心のおかげで(?)、長期休みの度に海外に1ヶ月間放り出されていた自分は、サンフランシスコにも滞在したことがあった。

 

そのせいかサンフランシスコ近郊の地図はなんとなく覚えていて、その記憶に似ていた。

 

 

 でも魔女の宅急便の舞台となったのは、公式ではスウェーデンストックホルムとなんか小さい島みたいな感じのとこらしいから見当違いかな、と思い直してみたり。

 

ケーブルカーこそあれど、あのでっかい時計台みたいなのもないしね。

 

 

 

 

 

てなわけで僕の予想は的外れだったわけだけど、せっかくサンフランシスコの話も出たし、宮崎駿大監督と僕の関係について話そうと思う。

 

 

先に結論から述べると、僕の知り合いの奥さんの叔父さんがかの宮崎駿監督なのかな。

 

 

サンフランシスコ近郊にはオークランドとバークレーっていう二つの市があって、僕は滞在時はオークランドに住んでいた。

 

 

そのオークランドといえば1年に450人が死ぬって言われているアメリカ有数の超危険地帯なんだけど、

 

そんな都市に一つ、世界中のディズニー映画を観たことがある人なら誰でも知っているスーパー企業がある。

 

 

 

 

ピクサー・アニメーション・スタジオ』

 

 

 

 

世界中のトップデザイナーが集まる芸術エリート集団。

誰もがこのロゴを見たことがあると思う。

 

 

f:id:sakigakeman:20160213000154p:plain

 

 

縁あってそのピクサーの中を見学させてもらった僕は(一般見学は出来ない)、そこで堤大介さんという方に内部を案内してもらった。

 

もう一度いう、堤大介さんだ。

 

堤大介さん。

 

 

f:id:sakigakeman:20160213000342p:plain

 

 

 

 

そう、この堤大介さんだ。

 

 

仮に堤大介さんを知らなかったとしても、とりあえず才能溢れている人というはわかると思う。

でもこれだけじゃ終わらない終われないのがこの人のすごいところ。

 

 

次にすごいのはこの人の奥さんで、名前はメイさん。

そして同時に、宮崎駿監督の姪っ子さん。

 

日本人なら誰もが知っているこの人↓のモデル。

 

 

f:id:sakigakeman:20160213000436j:plain

 

 

 

 

 どれだけ映画というものに縁のある夫婦か想像が付くだろうか。

 

そしてこの夫婦には子どもがいる。名前はセンジュ君。

 

 

もし家に映画「モンスターズ・ユニバーシティー」のDVDがあったら、その子の名前が書かれているシーンを見つけて見て欲しい。

 

 

f:id:sakigakeman:20160213000550j:plain

 

 

f:id:sakigakeman:20160213000613p:plain

 

(※一応SENJUと書いてある。撮影者は自分。)

 

 

将来子どもが出来たら『センジュ』と名づけて、この写真を「これはねーパパが命令して書かせたんだよー。」とかなんとか言っておくと、父親の威厳を子に示す良い機会になるかもしれない。

 

とまー僕と宮崎駿大監督の関係はこんな感じ()

 

 

ジブリ好きの僕としてはこの関係は嬉しい限り。

 

そういえばもしピクサー見学したいって人へ、今はもう堤大介さんはピクサーから独立してるからアポ取りは難しいのかもしれないけど、とりあえず行った感想を伝えておくと、広い。以上。

 

 

次は統計ソフトRの話か最近のcmの話。

 

 

 

参照URL

元ピクサー堤大介によるアカデミー賞ノミネート作「ダム・キーパー」字幕版上映 - 映画ナタリー 等。