[広告]

2014年6月6日金曜日

ウェブスクレイパー開発記録(2) LibreOfficeでの苦戦

Baseで文字化けに悩まされる

会社ならともかく、個人ではMS Officeとかは持っていないので、基本的な道具として、深く考えずにLibreOfficeを選択しました。

Calcを起動して、動物園・水族館の施設名とWEBサイトのURLを入力していく、それだけの簡単な作業です。

ところがこれに、所在地だとか、入園料だとか、開園時間だとかの情報を入力していると、さすがに表計算ソフトというだけあって、面倒くさくなってきました。

そこで、そもそもDBソフトであるところのBaseでの管理に移行しました。

フォームを作れば入力作業の効率はぐんと上がります。

けれどもここで問題が発生しました。

Baseで入力したデータの取り出し方が分からないのです。

Baseを起動して見ればいいじゃないかと普通なら考えるのですが、私の場合、出来上がったDBを仲間と共有したいです。

誰もがLibreOfficeを持っているわけではないので、せめてExcel形式で出力しておきたい。

ということで、テーブルのデータをコピーして、Calcにペースト。

そうしたら、見事に日本語の部分が文字化けしてしまいました。

まあ、フリーソフトならこの手のトラブルはよくあることです。

こういう場合はデータを一旦テキストデータに出力してしまえば...いいはずなのですが、Baseは直接テキストデータを出力することができません。

公式リファレンスを見ても、テーブルの内容をCalcにペーストして、Calcからテキスト形式で出力せよとなっています。

ちなみに、Baseはテキストデータのインポートも直接はできません。Calc経由です。

Calcへのデータ受け渡し方法はコピー&ペーストのみ。

というわけで、簡単にはトラブル回避ができません。

そこでGoogleで調べたところ、https://forum.openoffice.org/ja/forum/viewtopic.php?f=16&t=209 という情報を入手することができました。

ここの情報に従い、BaseのテーブルをCalcにドラッグ&ドロップすることで無事、データを取り出すことができました。

けれども、もう、なるべくBaseは使いたくないと思わせるに十分な出来事でした。

入力作業をBaseのフォームでまとめて済ませてしまい、それが終わったらCalcにデータを移し、あとのメンテナンスはCalc上でやってしまおうと思いました。

細かい部分の使い勝手については、やはりExcelは素晴らしいソフトだなとあらためて感じさせられもしました。

Calcが重たい

後でひっかかった件なのですが、まとめて先にここに記録しておきます。

ウェブスクレイパーに投入する元データをCalcで管理しはじめたころ、やけに動作が重たいことに気づきました。

たかだか数百件なのに、レコード一つ挿入するだけで何秒も待たされます。

とてもやってられないというので、急遽Gnumericをダウンロードし、こちらにデータを移し替えて作業を継続するところまで行きました。

ちなみにGnumericもいいソフトなのですが、Excel基準で考えると、操作方法がCalcよりもさらに一癖あります。

それにWEB上の資料がCalcよりも少なくて、不安をかかえながらの作業になりました。

ところが、偶然、Googleで検索していて、Calcの動作が重たくなった原因が分かりました。

とても残念なことに、今、いくら検索しても、そのソースを見つけることができません。どなたかのブログだったかと思うのですが。

とりあえず、記録として、ここに原因を記載しておきます。

LibreOffice の特定のバージョンに限った話なのですが、Calcでセルに長い文字列が入っていると、動作が極端に遅くなる現象が生じるそうです。

私が使っているLibreOfficeのバージョンは4.2でした。3.xならこの現象は生じないとのこと。

また、OpenOfficeでも生じないとのことでした。

というわけで、2014年6月6日現在、私はOpenOffice Calcで動物園DBの作業を進めています。

0 件のコメント:

コメントを投稿