■掲示板に戻る■ 全部 1- 最新50

メモ3

1 :名無しさん@勉強中 ★ :07/08/04 06:09:43 ID:???
またまた思いついた事など

2 :名無しさん@勉強中 ★ :07/08/04 06:11:13 ID:???
メモ

http://tmp6.2ch.net/test/read.cgi/download/1177253614/945
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
945 名前:[名無し]さん(bin+cue).rar[sage] 投稿日:2007/08/04(土) 03:00:03 ID:tcZVe2WO0
p2todatでURLがない場合、該当Dat落ちスレのURLを書き込みプレビューから
P2todatでDat取得しているのだが、手間かかる。
そこでDat取得したい場合、URL入力ダイアログが出て、そこに該当URLを入力して
そのDat落ちURLをp2datで取得ってできませんかね。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


下記で良いのでは。

p2todatに手動入力=p2todat.exe $INPUT


というか
JaneNidaって書き込みプレビューから外部コマンド起動出来ないみたい
出来れば嬉しくなるです(私が)

3 :名無しさん@勉強中 ★ :07/08/04 06:29:23 ID:???
質問?ボコボコにしてやんよ!
http://bokoboko.dip.jp/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
当サイトでは、2chのニュース速報(VIP)板で常時作成され短時間で落ちてい
く全レス&質問スレッドをアーカイブし、読みやすくなるよう再構築を行っています。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

現役のスレッドもすぐさま載るようにされてるみたいなので
スクリプトで即時反映するようにしておられるのかな。

で、使われているスクリプト言語なんですが
拡張子を見てみると「index.py」とか「view.py」なので
pythonをお使いなのかと。
すごいなー。

4 :名無しさん@勉強中 :07/08/05 20:07:06 ID:nWkmOygq
「スクリプトで即時反映」は大袈裟で
一定時間毎に自動更新されてます
以上 突っ込まれても痛いので。


この方、上の以外にも色々やられてるですね。

カスレッド!1人あわせてカスレッド!(β)
http://kathread.dip.jp/
安価たすぜ!
http://ankar.dip.jp/


で、見てみたら
PythonってRedHat系のLinuxには標準搭載されてるとか。
まあ「ソースは2ch」の典型ですが

Pythonお勉強スレッド
http://wing2.jp/~mirrorhenkan/2ch/python/prog/read-light.php/965815778/1



pythonってどういうものなのか見てみたら
やはり他のものとは違うですね(当たり前ですが)

Japanese Python Link
http://homepage1.nifty.com/kazuf/pythonlinkj.html
Python
http://www1.u-netsurf.ne.jp/~merita/python/python40.html

5 :名無しさん@勉強中 ★ :07/08/05 21:24:06 ID:???
暇じゃないので物理の勉強する
http://slpy.blog65.fc2.com/blog-entry-872.html

意外や意外
DAT2HTML0.26でdat化出来ちゃった。
(IDのフォントタグはそのままだったけど)

6 :名無しさん@勉強中 ★ :07/08/06 02:50:27 ID:???
メモ

例えば

http://www.youtube.com/watch?v=LudWVcdce_w

のflvの場所は

http://74.125.14.24/get_video?video_id=LudWVcdce_w

みたいです。

http://cache.googlevideo.com/get_video?video_id=LudWVcdce_w

でやってみたら
ステータス302でそっちのURL指定が出て
DL出来なかったので。

というか
IPの数字も固定かどうかわかんない。
固定だったら、自分が使う用に
フォーム入力でDLリンクが出るようなJavaScriptでもやってみますか。



それにしても、以前はURLだけではflv取得出来なかったのに
今出来るようになってるのは
どういう方針変換なのだろう。

こんな記事とか関係あるのかな。

http://la.ma.la/blog/diary_200702282253.htm
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
YouTubeの動画を全画面表示したり字幕くっつけたりするのを作るには、
動画の元ファイル(flv)のURLを知る必要がある。これはAPI使ってるだけ
だと出来ないので、スクレイピングというやつをする。具体的には動画の
貼られているURLにアクセスして、一定期間有効らしいトークン文字列を
抜き出して、get_videoにvideo_idとトークン文字列をわたすとflvのURLに
リダイレクトされる、ということらしい。

少なくともニコニコ動画は通常のAPI利用じゃない、はずだ。公開されてる
APIを使ってて蹴られたっていうならケチくさいな、と文句言えばいいけど、
スクレイピングしてやってるんだから、いつアクセス拒否されてもおかしく
ないし、それはYouTube側の当然の権利だろう。flvの直接利用ってのも
デリケートな問題だ。ビデオファイルを直接保存されてしまうと、アップロ
ードした権利者のコントロールが及ばなくなる。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

「スクレイピングされて負荷が増えるくらいなら いっそDLできるようにしてしまえ」とか。
2chでも 以前はdatの直DL出来なかったのが今は出来るのもそんな理由かもなと。

で、ニコニコ動画のほうは
flvの直DLはまだ難しいのかな。
何かリファラが違うとDL出来なくなってしまったとか見たような記憶があるですが。

7 :名無しさん@勉強中 ★ :07/08/06 19:40:08 ID:???
書式メモ

美人ニュース+(femnewsplus)
http://wannabe.fam.cx/service/2ch_11/read.cgi?femnewsplus/1186116907/l50
ラウンジクラシック(entrance2)
http://wannabe.fam.cx/service/2ch_14/read.cgi?entrance2/1181567761/l50
野生生物(wild)
http://wannabe.fam.cx/service/2ch_12/read.cgi?wild/1183163198/l50
生活サロン(lifesaloon)
http://wannabe.fam.cx/service/2ch_16/read.cgi?lifesaloon/1147088804/l50
セピア(sepia)
http://wannabe.fam.cx/service/2ch_13/read.cgi?sepia/1186393379/l50
ペット大好き(pet)
http://wannabe.fam.cx/service/2ch_17/read.cgi?pet/1183261138/l50
クラシック(classical)
http://wannabe.fam.cx/service/2ch_15/read.cgi?classical/1185398813/l50


いやすごいっす。
あんまり無理せんといて下さい>DinoSwiftさん

8 :名無しさん@勉強中 ★ :07/08/06 19:46:01 ID:???
DinoSwiftさんの所を見て思い出したのですが

ラウンジクラシック板は2ch本体にはログを残さない場所との事だったので
スクリプトでローカル保存したものがあったっけです

過去ログ倉庫
http://www2.atpages.jp/entrance2/

どこからだか覚えてないですけど
途中からdatをDLするようにしたもんで
404の場合は拡張子をdatにすると存在しているかも。

同じように
メニューのみ保管したものもやってあったです

にくちゃんねる過去ログ墓場
http://www2.atpages.jp/list/


上二つどちらも1ギガ近い容量を使っておるもんで
ビクビクドキドキで 表に出してなかったです
さあ出してみてどうなるか。

それと、設置してからphpが使える事を知ったので
何だか勿体ない使い方をしてしまったかなと。

9 :名無しさん@勉強中 ★ :07/08/06 19:52:10 ID:???
あと このサイトですが
datファイルに広告をつけてしまうところなんですが
さてどうしましょ。

tripod.comもそうだったんですが>datに広告タグが付く
専用ブラウザのほうで対処出来ないかな。

10 :名無しさん@勉強中 ★ :07/08/08 02:02:22 ID:???
<見えない文章>
 makimo.toさん復活ありがとうございます
 makimo.toさん復活おめでとうございます
</見えない文章>

11 :名無しさん@勉強中 ★ :07/08/08 02:28:54 ID:???
メモ

http:;//61.125.195.90
http://segabito.biford.com/



http://etc6.2ch.net/test/read.cgi/qa/1141102799/317とか見ると
間歇的に復活なさっているのでしょうか。

12 :名無しさん@勉強中 ★ :07/08/08 15:06:47 ID:???
VBScript で画像ファイルの画像の大きさを取得する (unibon)
http://www.geocities.co.jp/SiliconValley/4334/unibon/asp/getimagesize.html
VBScript Tips (Tips0057)[画像ファイルのサイズを取得する]
http://www.whitire.com/vbs/tips0057.html

13 :名無しさん@勉強中 ★ :07/08/10 19:29:38 ID:???
http://pc11.2ch.net/test/read.cgi/hp/1184908688/526

久しぶりに見てみたら、自分が書いた筈のスクリプトなのに
んもう わかんないの何の。

あの頃 私は偉かった。

14 :名無しさん@勉強中 ★ :07/08/11 19:26:27 ID:???
http://jane.s28.xrea.com/test/read.cgi/bbs/1180559017/324
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
(前略)

-参考-
2ch DAT落ちスレ ミラー変換機 ver.5
yellow.ribbon.to/~mirror/
yellow.ribbon.to/~mirror/url.php.txt
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

php版を参考にされても
リンダいや私困っちゃうですよ
んもう色々直すのも厄介だもんで

15 :名無しさん@勉強中 ★ :07/08/12 22:50:39 ID:???
http://www.23ch.net/
を追加させて頂いたです
ドメインを見ると2007/06/02に登録されたそうで。

ここ スレッドに書かれていたので判ったのですが
何故かgoogleでもyahooでもmsnでもmooterでもbaiduでもヒットしなかったので
もしかしたら23ch管理人さん御自らの書き込みなのかなと思ったりして。
あと雰囲気がdumper.jpさんと似ている感じがしたのですが
ドメインの登録先が全く違ってたです
いやーみんなすごい

で、ここ 恥ずかしながらdatの位置がどうも判らない。
これとアタリをつけた所で呼び出しても404で。
まあhtmltodatの「read.cgi?7.00」でdat化出来るのでいいかなと。

あと、どういうタイミングで保管されているのかもようわからんです
例えばhttp://etc6.2ch.net/test/read.cgi/qa/1141102799/とかは
まだ保管されてないようですし。


あと携帯用中間サーバを二つ追加して
ミラー保管用ボタンのエラーを無くしたです

16 :名無しさん@勉強中 ★ :07/08/13 00:04:08 ID:???
書き間違い
http://23ch.info/
でした(^^;)

メモ
222.225.251.7

17 :名無しさん@勉強中 ★ :07/08/13 00:07:34 ID:???
また間違えた

http://www.23.info/

ああダブルエラー

18 :名無しさん@勉強中 ★ :07/08/13 00:59:40 ID:???
ああトリプルエラー

http://www.23ch.info/

19 :名無しさん@勉強中 ★ :07/08/15 16:14:35 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1175735168/661-663n

なぜ5年前のスレッドが其処に残しておられたのかはともかく
(共同幻想を抱いてもいいかなとは思うですが)
これをdat化出来ないという理由は
レス1からラストまでを一覧表示出来ないからなので。

http://2ch-i.net/&/live.2ch.net/endless/1035922530/

のままだと全部表示出来ないので

http://2ch-i.net/&/live.2ch.net/endless/1035922530/1-640

とやっても、1から10までしか表示出来ないです。
携帯用なのでそういう縛りを管理人さんが付けられても仕方ない。



もし10レスだけでいいのなら
例えば
http://2ch-i.net/&/live.2ch.net/endless/1035922530/1-10.i
だと

正規表現
m#<p>\[([0-9]+):(.+?)(?:≪(.+?)≫)? \((.+?)\) <a href=".+?">AA</a>\]<br> +?(.+?)</p>.*?<hr>(<p>|<a)#mik

前処理
s#(<title.*?): 2ch-imode(</title>)#$1$2#k

変換結果式
メール欄逆転

でdat化出来るのかなと思うです。

20 :名無しさん@勉強中 ★ :07/08/15 16:22:58 ID:???
それでも諦めずに
なおかつdat化を試みるとするならば

http://2ch-i.net/&/live.2ch.net/endless/1035922530/1-10.i
http://2ch-i.net/&/live.2ch.net/endless/1035922530/11-20.i
http://2ch-i.net/&/live.2ch.net/endless/1035922530/21-30.i
http://2ch-i.net/&/live.2ch.net/endless/1035922530/31-40.i
http://2ch-i.net/&/live.2ch.net/endless/1035922530/41-50.i
 ・・・
  (中略)
 ・・・
http://2ch-i.net/&/live.2ch.net/endless/1035922530/631-640.i

のそれぞれを各自でdat化して
できあがったものを連結させればできそうです。
まとめてDLして一括置換して一括連結すればそう面倒でもなさそう。


ただここで問題になるのは
スレッドのタイトルがおのおのに付いてしまう事で。
レス1ー10の時以外は必要がないのですが
全部に付いてしまう。

という訳で、心臓バクバクものですが
htmltodatサポート板にまた要望を書かせて頂こうかなと。

21 :名無しさん@勉強中 ★ :07/08/15 16:44:35 ID:???
追記

http://2ch-i.net/&/live.2ch.net/endless/1035922530/41-50.ni

みたいにしないと
レス1がついてしまうみたい。

22 :名無しさん@勉強中 ★ :07/08/15 23:23:21 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1165245437/358

ああ恥ずかしい事を書いてしまった
恥ずかしいのう
恥ずかしいのう
ギギギ


私もwshクローラーを出してますが
使うとる人居るのかな。

http://www.geocities.jp/mirrorhenkan/others/datget/
http://www.geocities.jp/mirrorhenkan/others/datsearchget/

これをタスクスケジューラ等で
例えば一時間毎に実行するようにすれば
みみずんさんやDinoSwiftさんのような事が出来ると思うですが。
DinoSwiftさんの出されたCGIのほうが良さそうですけど。


そういえば
perlクローラーとphpクローラーも作ったっけだなー。
出しとけば誰かが活用してくれるかもしれないな とか。

23 :名無しさん@勉強中 ★ :07/08/15 23:47:42 ID:???
で、メモ

「datsearchget」をgoogle検索したら
下のがヒットしたです

【●】「にくちゃんねる」休止のお知らせ・・・・・・ 過去ログ倉庫【買うか?】
http://2se.dyndns.org/test/readc.cgi/news20.2ch.net_news_1164162822/l50

で、上の中にある単語で検索してみたら
何だか面白そうな事をやっておられるですね。

syoboon
http://www.asks.jp/users/syoboon/
prototypeのお勉強とその他色々
http://2se.dyndns.org/test2/dat_check.htm

24 :名無しさん@勉強中 ★ :07/08/15 23:51:17 ID:???
さらに検索してみると
同じ方の別のブログ

YNET Weblog
http://blog.yuhisa.com/

25 :名無しさん@勉強中 ★ :07/08/15 23:58:43 ID:???

ブログから辿ってaboutを見てみると

http://www.yuhisa.com/about.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
また、2005年からは、2ch関係を色々とふれてみたり
2006年後半からはASKS?で色々と活動?しております。

2006年4月に2ちゃんねるで使用されていた
Banana(tmp5)サーバーを頂きました。
ありがとうございました。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


うわー
すごいお方なのですね。

26 :名無しさん@勉強中 ★ :07/08/16 00:58:00 ID:???
>>22の方って
makimo.toさんの掲示板にもお書きになってたんですね。



メモ

http://makimo.to:8000/i/d.cgi/news4vip/2ch.net/wwwww/1187190494/?&p=

これ
http://wwwww.2ch.net/test/read.cgi/news4vip/1187190494/
がdat落ちしても閲覧出来ていたら
どんなにか嬉しい事でしょうか。

ちなみに現在
現役スレの場合は

http:/makimo.to:8000/cgi-bin/dat2html/dat2html.cgi?http://wwwww.2ch.net/test/read.cgi/news4vip/1187190494/

で閲覧可能ですが
本家でdat落ちして、以前の所定位置に保管された場合

http://makimo.to:8000/2ch/wwwww_news4vip/1187/1187190494.html

に移動すると思うのですが
2chフォルダ以下をベーシック認証しておられるみたいです。


もしかしたら>>19-21と同様
携帯用表示からdat化するような方策を考えたら
何とかなるかもです

27 :名無しさん@勉強中 ★ :07/08/16 09:53:28 ID:???
>>19-21の件ですが
どうにかなったっぽい。

・切れ切れのhtmlをローカルにDL

・htmltodatで一括dat変換

・変換したdatの一覧リストを作成

・Excel等で昇順にソート

・wshで一括連結


これでどうでしょうか。
あとでスクリプトと説明htmlを書いてみますか

28 :名無しさん@勉強中 ★ :07/08/16 09:55:54 ID:???
それと

http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/467-469n

御返事ありがとうございます

> というわけでオプションで機能追加しないといけない必要性がよくわからないです。

すごく心臓がドキドキして
冷や汗がタラタラ流れてしまったです
あー駄目だ

実害が無ければそれでいいか・・。

29 : ◆/vmukiyuzw :07/08/16 19:24:15 ID:KY7Or5dG
>>28
自分のレスを読み返してみるとちょっと攻撃的な口調になってますね。
実はPCの調子が悪くリカバリにてこずっていたので
そのせいで少しイライラしていたかもしれません。
お気を悪くされたらすみません。

30 :名無しさん@勉強中 ★ :07/08/18 03:18:14 ID:???
お待たせ致しました。
お待たせし過ぎたと申しても過言ではございますまい。
(以上 村西とおるさんの声色で)

2ch-imodeのhtmlをdat化する試み
http://www.geocities.jp/mirrorhenkan/2ch-i/

とりあえず自分の環境ではうまくいっているように思えます。
とはいえ注意点というか留意点があるですが
ごめんね疲れちゃった

あと一行目二行目ですが
別に誰も待ってないですよね
ハハハ


>>29
いえそんな。
ところで、これいじっている時に
また二点ほど要望が浮かんだのですが
それはまた後日お願いしますという事で。

31 :名無しさん@勉強中 ★ :07/08/18 03:32:30 ID:???
で、たまたまですが

http://ex20.2ch.net/test/read.cgi/gline/1175735168/680-681n

で出ていた

http://news19.2ch.net/test/read.cgi/newsplus/1099018630

を、2ch-imodeからdat化してみました。

http://pantomime.jspeed.jp/test/read.cgi/monament5/1099018630/

で、やってみたら
スレッドタイトルがうまくいってないみたい。
うん後日考えようか

32 :名無しさん@勉強中 ★ :07/08/18 03:42:12 ID:???
あれれ
正規表現が化けてる?
PCが原因なのだろうか

http://www.geocities.jp/mirrorhenkan/2ch-i/2ch-imode_regexp.txt
m#<p>\[([0-9]+):(.+?)(?:≪(.+?)≫)? \((.+?)\) <a href=".+?">AA</a>\]<br> +?(.+?)</p>.*?<hr>(<p>|<a)#mik

33 :名無しさん@勉強中 ★ :07/08/18 08:31:59 ID:???
メモ

http://makimo.to:8000/i/d.cgi/news4vip/2ch.net/wwwww/1187190494/?&p=

正規表現
m#<hr>([0-9]+):(.+?):(.+?)(?:\[(.+?)\])?<br>(.+?)(<hr>)#mki

前処理
s#(<title>)29-(.*?</title>)#$1$2#k
s#<a href=/i/d.cgi/.+?>([a-z0-9\.\$,\;\:\&=\?\!\*~@\#_\(\)%/'+-]?)</a>#http://$1#igk

変換結果式
$2<>$4<>$3<>$5<>


いろいろ変です
前処理がよくないですし
レス1・3・4・7の名前欄も変

34 :名無しさん@勉強中 ★ :07/08/18 11:26:38 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1175735168/685-686n

「その31」では無かったっけや
「その32」だもな

35 :名無しさん@勉強中 ★ :07/08/18 18:51:56 ID:???
>>33の件ですが
単にコロン「:」をデリミタにするだけでは具合が悪いみたい。
日付とIDの所でもコロンを使っているもので。
下記

1:以下、名無しにかわりましてVIPがお送りします。:08/16 00:08.92 ID:r+szmpmV0


どうすればいいのでしょうか。

36 :名無しさん@勉強中 ★ :07/08/19 11:24:44 ID:???
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/470-473n

sprintfがJavaScriptに実装されていたら
どんなにか良かった事でしょう

37 :名無しさん@勉強中 ★ :07/08/19 12:17:57 ID:???
という訳で
sprintfするようにしたです

http://www.geocities.jp/mirrorhenkan/2ch-i/

ソートでうまくソートできるでしょうか
うまくいったらおなぐさみ
ダメだったら そーっとしておいてやってくんなまし

38 :名無しさん@勉強中 ★ :07/08/19 12:21:37 ID:???
ふむ
このURL形式で呼び出すと
最初のレス番が少し変わるですね。

例えば

http://2ch-i.net/&/sakura02.bbspink.com/erochara/1138189892/0171-0180.ni

とやると
レス171が

[0171:名無しさん@ピンキー≪sage≫ (2006/01/30(月) 20:38:47 ID:???) AA]

となるですよ。

実害がなければ別にいいか。

39 :名無しさん@勉強中 ★ :07/08/19 12:31:29 ID:???
トリップの</b><b>も消えておるみたい

後処理
s#(\n.*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk

beリンクも消えてるですが
これはちょっとどうしようもないなー

40 :名無しさん@勉強中 ★ :07/08/19 18:41:18 ID:???
疲れたので後日

メモ
新明快国語辞典を読む
http://www.geocities.co.jp/Bookend-Soseki/3578/index.html

41 :名無しさん@勉強中 ★ :07/08/21 12:49:06 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1175735168/693-697n

自分の環境では難なくdat化出来ましたが
だからどうしたと言われても何でもないよと答えるしかない訳で。

42 :名無しさん@勉強中 ★ :07/08/21 13:21:05 ID:???
で 考えてみたら

現状では「リスト作成」「結合」でそれぞれスクリプトを割り当てていて
合計二つのvbsがあるのですが
これを一つのスクリプトにすればよいかもしれないなと。

くっつけるのはそう難しくもなさそうですし。

43 :名無しさん@勉強中 ★ :07/08/21 20:24:20 ID:???
前スレ845ですが
Adodb.streamを使えば簡単に出来ますね。

ただ 自分のPCのOSバージョンだと
その命令を使おうにも
そもそも使えないというネックがありますけど。

44 :名無しさん@勉強中 ★ :07/08/22 10:06:27 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1175735168/700

ふむ
複数ファイルのダウンロードまで自動化するようにしましょうかね。
ダウンロードしたものをそのまま単純に連結するのも可能ですな。

# 以前やったものだと例えば
# http://www.geocities.jp/mirrorhenkan/others/subjectget/
# とかはまさしくそれだったなーと

ただ問題は、
htmlを単純に連結したものをdat化する際
htmltodatのほうで認識してくれるかどうかで。
こればかりはやってみないとわからない。

スクリプトで出来る範囲の事で考えたら
wshでdat化までやろうと思えばできると思いますけど
車輪の再発明以上のものにはなりそうもないので やめます。

何もかも自作に固執するほど大した人間でもないですし。

45 :名無しさん@勉強中 ★ :07/08/23 08:18:11 ID:???
syoboon
http://syoboon.asks.jp/
http://www.asks.jp/users/syoboon/tag/dat

いや面白い面白い。(って あんまりわかんないですが)

わかんないなりに読んでみると
今までログをMySQL管理していたのですが
件数・容量や分散サーバでの管理の関係で
昨晩からMySQLをやめたみたい。

DinoSwiftさんの逆をおやりになったという事なのかな。
(DinoSwiftさんはMySQL導入を予定しておられるので)



そういえば實松アウトプットさんのブログが止まってますが
もしかしたら私のせいなのでしょうか。

http://sane.justblog.jp/

まあ私のせいだとしても
正直どうしようもないんですが・・。

46 :名無しさん@勉強中 ★ :07/08/23 18:26:21 ID:???
>>44の件
少し考えたらどちらも出来そうですが
気が向いたらやってみますか。
まあ誰も待ってないでしょうから気楽なもんです

それより
>>43(前スレ845)の件
少し面白そうなのでやってみますか。
ただし
私のPCでは動作検証が出来ないので
見ておられる方々に試して頂きたく思いますが。


実際、どれほどの人がここ見てるんでしょうね。
専用ブラウザで見ておられる方々とかだと全然わかんないですし。

47 :名無しさん@勉強中 ★ :07/08/23 18:33:15 ID:???
さっきから個人的にやってたのですが
Excel VBA の URLDownloadToFile関数(?)を使えば
ADODB.streamを使わずとも同等の事が出来そうですね。
手始めにVBAのスレッドを集めてみますか。

Lotus1-2-3のマクロなら遙か昔にやった事がありますが
ExcelのVBAとかって全然違いますね。
でもVBScriptとそっくりなので(って多分同じなんでしょうが)
今の自分には結構理解しやすいかも。
「覚えて何になるんだ」という思いも少しあるですが。

それと
自分の環境だと「2ch=」は起動出来ない(強制終了)ので
何とも寂しいです。

48 :名無しさん@勉強中 ★ :07/08/23 23:24:02 ID:???
変換書式メモ

ネットwatch板(net)
http://wannabe.fam.cx/service/2ch_18/read.cgi?net/1181131453/l50
小規模MMO(mmomiror)
http://wannabe.fam.cx/service/2ch_19/read.cgi?mmominor/1179967285/l50
ネトゲ質問(mmoqa)
http://wannabe.fam.cx/service/2ch_20/read.cgi?mmoqa/1187356673/l50

49 :& ◆dWur1o.xTE :07/08/24 00:50:52 ID:MyE0eXgv
(へ´ω`) >>45
      おいらもちょっと拝見してきた。

      どういう運用の仕方してたのかわからないけども
      おいらのお世話になっているプログラマーの人の話では
      圧縮しながらmySQL使うのはあまりよくないみたいだし
      それだったら「mySQLで管理する意味あるのだろうか?」って気がしてきた。
      恩恵受けるのはそこのサイトにも書いてあったように検索のときだけだと思う。
      でもおいらの自作検索だとしょぼいし重いしでいいことないんだよね。
      あまり意味がないのだったらテラ単位のHDDでも買って
      今の状態で鯖と通常仕様するパソコンを切り離すだけでOKな気がしてきた。

      面倒だからお金たまったら鯖専用機でも買おうかなぁ・・・。

50 :名無しさん@勉強中 ★ :07/08/24 19:59:27 ID:???
いつもお世話になっていますです

実はMySQLを入れてみたのですが
さっぱりわからんちんでした。
そのうちノートPCが故障してしまったようで
それきりです
駄目だこりゃ


それにしても
Linuxといい
Operaといい
MySQLといい
フィンランドって凄い国なんだなあと。
関係ないか。

でもそれ以外だと
ネギ廻し・猫廻しの歌しか浮かばないのは
いかがなものかと。(自分に言ってるんですが)

51 :名無しさん@勉強中 ★ :07/08/25 07:50:50 ID:???
メモ

エクセル備忘録VBA編
http://www.page.sannet.ne.jp/je3nqy/excel/f_excel.htm
URLDownloadToFile site:2ch.net - Google 検索
http://www.google.com/search?hl=ja&lr=lang_ja&ie=UTF-8&oe=UTF-8&num=100&q=URLDownloadToFile++site%3A2ch.net
Office TANAKA - トップページ
http://officetanaka.net/index.stm
Excel World(ソーシャル・ネットワーキング・システム)
http://user.freespace.jp/excel/books/
猫とエクセル/VBA(マクロ)でつくるフリーゲーム
http://www.geocities.co.jp/SiliconValley-Cupertino/8748/
地名検索 郵便番号検索
http://www.geocities.co.jp/SiliconValley-Cupertino/8748/sonota.htm

52 :名無しさん@勉強中 ★ :07/08/25 18:40:55 ID:???
自分の環境では試せないので
余裕のある方に試して頂きたく。

http://www.geocities.jp/mirrorhenkan/others/getimg/getimg.vbs.txt

上のファイルをDLして拡張子をvbsにして実行してみて下さい。
同じフォルダにtest.gifが出来て yahooの画像だったら成功です。

ある程度書いた(てかあっちこっちからコピペ)ですけど
肝心かなめのこれが使えなかったらアホらしいので。

何か反応があるまで手をつけられないです

53 :659:07/08/25 19:26:50 ID:Lz1sr9aR
>>52
私の環境で動くのを確認しました

54 :名無しさん@勉強中 ★ :07/08/26 10:19:20 ID:???
>>53
どうもありがとうです。

このスクリプトなんですが
下の凄い方のBBSの書き込みからコピペしたものです

Windows Script Host Laboratory
http://www.roy.hi-ho.ne.jp/mutaguchi/wsh/

いやー凄い。
色々おうかがいしたい事とかあるですが
まあ門前払いでしょうね。
時代はwshよりもwmiやPowerShellなんだそうですが
全盛期もとい前世紀の私のマシンではそんな境地に辿り着けるはずもなく
遙か彼岸に見える未来の夢の技術にひたすら思いを馳せるのみで



メモ

vbs 正規表現 - Google 検索
http://www.google.com/search?hl=ja&lr=lang_ja&ie=UTF-8&oe=UTF-8&num=100&q=vbs+%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%8F%BE
VBScript|VBSで正規表現を使用する
http://www.kanaya440.com/contents/tips/vbs/004.html
VBScript Tips
http://www.whitire.com/vbs/
VBScript Tips (Tips0056)
http://www.whitire.com/vbs/tips0056.html
adodb.stream 画像 保存 - Google 検索
http://www.google.com/search?hl=ja&lr=lang_ja&ie=UTF-8&oe=UTF-8&num=100&q=adodb.stream+%E7%94%BB%E5%83%8F%E3%80%80%E4%BF%9D%E5%AD%98
ふたば☆ツール
http://plutonium.hp.infoseek.co.jp/futaba/
VBSとか
http://plutonium.hp.infoseek.co.jp/
VBSとか
http://plutonium.hp.infoseek.co.jp/sample/index.html

55 :名無しさん@勉強中 ★ :07/08/26 12:56:06 ID:???
VBAスレを見ていたんですが
少し疑問が。
VBAについてじゃないです


Excel VBAについて Ver.2.0
http://pc2.2ch.net/test/read.cgi/tech/1055153917/

上記スレ 347レスでdat落ちしてるみたいなんですが
次スレとかを見てみると1001まで行ったみたい。
過去ログ倉庫も人大杉で駄目で
サーバ移転でpc5に行った訳でもなさそうですし

で、調べてみたら
みみずんさんの所とかで997とかあるじゃないですか。

Excel VBAについて Ver.2.0
http://mimizun.com/search/perl/dattohtml.pl?http://mimizun.com/log/2ch/tech/pc2.2ch.net/tech/kako/1055/10551/1055153917.dat

もしかしたら●持ちさんが取得してみたら
1001まであるのかな
それとも347までなのかな
どっちなのかな
でも人の手を煩わせるのも何だしな

と思ったです。


レアケースなのかもしれませんが
これでは関連スレッドを集めるのがもっと大変になるですよ。


56 :名無しさん@勉強中 ★ :07/08/26 23:55:34 ID:???
メモ
EXCEL総合相談所58
http://pc11.2ch.net/test/read.cgi/bsoft/1183791959/
EXCEL総合相談所57
http://pc11.2ch.net/test/read.cgi/bsoft/1181155085/
EXCEL総合相談所56 (1001)
http://pc11.2ch.net/test/read.cgi/bsoft/1177732915/
EXCEL総合相談所55 (1001)
http://pc11.2ch.net/test/read.cgi/bsoft/1174961523/
EXCEL総合相談所54 (1001)
http://pc11.2ch.net/test/read.cgi/bsoft/1172140808/
EXCEL総合相談所53 (1001)
http://pc10.2ch.net/test/read.cgi/bsoft/1169806266/
EXCEL総合相談所52 (1001)
http://pc10.2ch.net/test/read.cgi/bsoft/1167923180/
EXCEL総合相談所51 (1001)
http://pc10.2ch.net/test/read.cgi/bsoft/1164813734/
EXCEL総合相談所51 (0923)
http://pc8.2ch.net/test/read.cgi/bsoft/1164813734/
EXCEL総合相談所50 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1161574770/
EXCEL総合相談所49 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1158766299/
EXCEL総合相談所48 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1156013015/
EXCEL総合相談所47 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1152852610/
【質問不可】EXCEL総合相談所スレの雑談・議論スレ2
http://pc11.2ch.net/test/read.cgi/bsoft/1151651536/l20
【質問不可】EXCEL総合相談所スレの雑談・議論スレ2 (0209)
http://pc8.2ch.net/test/read.cgi/bsoft/1151651536/
EXCEL総合相談所46 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1150639357/
EXCEL総合相談所45 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1148545360/
EXCEL総合相談所44 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1146083226/
EXCEL総合相談所43 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1143177051/
Excel総合相談所 42
http://pc8.2ch.net/test/read.cgi/bsoft/1140091414
EXCEL総合相談所40(実質41)
http://pc8.2ch.net/test/read.cgi/bsoft/1134120366/
EXCEL総合相談所39 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1131287690/
EXCEL総合相談所38 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1128606047/
EXCEL総合相談所37 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1125178942/

57 :名無しさん@勉強中 ★ :07/08/26 23:56:03 ID:???
EXCEL総合相談所36 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1121686643/
EXCEL総合相談所・雑談・議論スレ (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1120184635/
EXCEL総合相談所35 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1119886079/
EXCEL総合相談所34 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1117721050/
EXCEL総合相談所33 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1114997019/
EXCEL総合相談所32 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1112190520/
EXCEL総合相談所31 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1109340075/
EXCEL総合相談所30 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1106829956/
EXCEL総合相談所29 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1102922371/
EXCEL総合相談所28 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1099232633/
EXCEL総合相談所27 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1096068933/
EXCEL総合相談所26 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1091619391/
EXCEL総合相談所25 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1088690113/
EXCEL総合相談所24 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1085756069/
EXCEL総合相談所23 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1083074470/
EXCEL総合相談所22 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1078930810/
EXCEL総合相談所21 (1001)
http://pc2.2ch.net/test/read.cgi/bsoft/1076410405/
EXCEL総合相談所20 (1001)
http://pc2.2ch.net/test/read.cgi/bsoft/1073895316/
EXCEL総合相談所19 (1001)
http://pc2.2ch.net/test/read.cgi/bsoft/1069951870/
EXCEL総合相談所18 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1067264540/
EXCEL総合相談所18 (1001)
http://pc2.2ch.net/test/read.cgi/bsoft/1067264540/
EXCEL総合相談所17 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1062260735/
EXCEL総合相談所17 (1001)
http://pc2.2ch.net/test/read.cgi/bsoft/1062260735/
EXCEL総合相談所16EXCEL総合相談所16 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1060345528/
EXCEL総合相談所16EXCEL総合相談所16 (1001)
http://pc2.2ch.net/test/read.cgi/bsoft/1060345528/
EXCEL総合相談所15 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1057720306/

58 :名無しさん@勉強中 ★ :07/08/26 23:56:20 ID:???
EXCEL総合相談所15 (1001)
http://pc2.2ch.net/test/read.cgi/bsoft/1057720306/
EXCEL総合相談所14 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1055342774/
EXCEL総合相談所14 (1001)
http://pc2.2ch.net/test/read.cgi/bsoft/1055342774/
EXCEL総合相談所13 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1053069026/
EXCEL総合相談所13 (1001)
http://pc2.2ch.net/test/read.cgi/bsoft/1053069026/
EXCEL総合相談所12 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1050069432/
EXCEL総合相談所12 (1001)
http://pc2.2ch.net/test/read.cgi/bsoft/1050069432/
EXCEL総合相談所11 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1045997062/
EXCEL総合相談所11 (1001)
http://pc2.2ch.net/test/read.cgi/bsoft/1045997062/
EXCEL総合相談所10 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1042913355/
EXCEL総合相談所10 (1001)
http://pc2.2ch.net/test/read.cgi/bsoft/1042913355/
Excel総合相談所 9
http://pc.2ch.net/test/read.cgi/bsoft/1038376475/l50
EXCEL総合相談所8 (1001)
http://pc.2ch.net/test/read.cgi/bsoft/1033983470/
EXCEL総合相談所7 (0004)
http://pc.2ch.net/test/read.cgi/bsoft/1028862624/
EXCEL総合相談所7 (1001)
http://pc.2ch.net/test/read.cgi/bsoft/1028725250/
EXCEL総合相談所6 (1001)
http://pc.2ch.net/test/read.cgi/bsoft/1023811906/
EXCEL総合相談所5 (0996)
http://pc.2ch.net/test/read.cgi/bsoft/1018055390/
EXCEL総合相談所4 (1001)
http://pc.2ch.net/test/read.cgi/bsoft/1012439547/
EXCEL総合相談所3 (1001)
http://pc.2ch.net/test/read.cgi/bsoft/1004432306/
EXCEL総合相談所2 (1001)
http://pc.2ch.net/bsoft/kako/986/986283001.html
EXCEL総合相談所2 (0905)
http://mentai.2ch.net/bsoft/kako/986/986283001.html
EXCEL総合相談所 (0925)
http://mentai.2ch.net/bsoft/kako/965/965792827.html

59 :名無しさん@勉強中 ★ :07/08/27 00:35:46 ID:???
重複を除くと以下

EXCEL総合相談所58
http://pc11.2ch.net/test/read.cgi/bsoft/1183791959/
EXCEL総合相談所57
http://pc11.2ch.net/test/read.cgi/bsoft/1181155085/
EXCEL総合相談所56 (1001)
http://pc11.2ch.net/test/read.cgi/bsoft/1177732915/
EXCEL総合相談所55 (1001)
http://pc11.2ch.net/test/read.cgi/bsoft/1174961523/
EXCEL総合相談所54 (1001)
http://pc11.2ch.net/test/read.cgi/bsoft/1172140808/
EXCEL総合相談所53 (1001)
http://pc10.2ch.net/test/read.cgi/bsoft/1169806266/
EXCEL総合相談所52 (1001)
http://pc10.2ch.net/test/read.cgi/bsoft/1167923180/
EXCEL総合相談所51 (1001)
http://pc10.2ch.net/test/read.cgi/bsoft/1164813734/
EXCEL総合相談所51 (0923)
http://pc8.2ch.net/test/read.cgi/bsoft/1164813734/
EXCEL総合相談所50 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1161574770/
EXCEL総合相談所49 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1158766299/
EXCEL総合相談所48 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1156013015/
EXCEL総合相談所47 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1152852610/
EXCEL総合相談所46 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1150639357/
EXCEL総合相談所45 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1148545360/
EXCEL総合相談所44 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1146083226/
EXCEL総合相談所43 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1143177051/
Excel総合相談所 42(1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1140091414
EXCEL総合相談所40(実質41)
http://pc8.2ch.net/test/read.cgi/bsoft/1134120366/
Excel総合相談所 40(1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1134006968/
EXCEL総合相談所39 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1131287690/
EXCEL総合相談所38 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1128606047/
EXCEL総合相談所37 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1125178942/
EXCEL総合相談所36 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1121686643/
EXCEL総合相談所・雑談・議論スレ (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1120184635/
EXCEL総合相談所35 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1119886079/
EXCEL総合相談所34 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1117721050/
EXCEL総合相談所33 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1114997019/
EXCEL総合相談所32 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1112190520/

60 :名無しさん@勉強中 ★ :07/08/27 00:38:31 ID:???
EXCEL総合相談所31 (1001)
http://pc8.2ch.net/test/read.cgi/bsoft/1109340075/
EXCEL総合相談所30 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1106829956/
EXCEL総合相談所29 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1102922371/
EXCEL総合相談所28 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1099232633/
EXCEL総合相談所27 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1096068933/
EXCEL総合相談所26 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1091619391/
EXCEL総合相談所25 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1088690113/
EXCEL総合相談所24 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1085756069/
EXCEL総合相談所23 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1083074470/
EXCEL総合相談所22 (1001)
http://pc5.2ch.net/test/read.cgi/bsoft/1078930810/
●EXCEL総合相談所21 (1001)
http://pc2.2ch.net/test/read.cgi/bsoft/1076410405/
●EXCEL総合相談所20 (1001)
http://pc2.2ch.net/test/read.cgi/bsoft/1073895316/
●EXCEL総合相談所19 (1001)
http://pc2.2ch.net/test/read.cgi/bsoft/1069951870/


19−21は見つからぬ
代替として下記から該当スレをdat化させますか

過去ログ @OURS-2ch過去ログ倉庫
http://lib.ac.la/2ch/read.php/pc8/bsoft/b1

61 :名無しさん@勉強中 ★ :07/08/27 00:39:48 ID:???
下のはhtml化されてますが
唯一パート9のみ未html状態

EXCEL総合相談所18 (1001)
http://pc5.2ch.net/bsoft/kako/1067/10672/1067264540.html
EXCEL総合相談所17 (1001)
http://pc5.2ch.net/bsoft/kako/1062/10622/1062260735.html
EXCEL総合相談所16EXCEL総合相談所16 (1001)
http://pc5.2ch.net/bsoft/kako/1060/10603/1060345528.html
EXCEL総合相談所15 (1001)
http://pc5.2ch.net/bsoft/kako/1057/10577/1057720306.html
EXCEL総合相談所14 (1001)
http://pc5.2ch.net/bsoft/kako/1055/10553/1055342774.html
EXCEL総合相談所13 (1001)
http://pc5.2ch.net/bsoft/kako/1053/10530/1053069026.html
EXCEL総合相談所12 (1001)
http://pc5.2ch.net/bsoft/kako/1050/10500/1050069432.html
EXCEL総合相談所11 (1001)
http://pc5.2ch.net/bsoft/kako/1045/10459/1045997062.html
EXCEL総合相談所10 (1001)
http://pc5.2ch.net/bsoft/kako/1042/10429/1042913355.html
Excel総合相談所 9
http://pc.2ch.net/test/read.cgi/bsoft/1038376475/l50
EXCEL総合相談所8 (1001)
http://pc.2ch.net/bsoft/kako/1033/10339/1033983470.html
EXCEL総合相談所7 (0004)
http://pc.2ch.net/bsoft/kako/1028/10288/1028862624.html
EXCEL総合相談所6 (1001)
http://pc.2ch.net/bsoft/kako/1023/10238/1023811906.html
EXCEL総合相談所5 (0996)
http://pc.2ch.net/bsoft/kako/1018/10180/1018055390.html
EXCEL総合相談所4 (1001)
http://pc.2ch.net/bsoft/kako/1012/10124/1012439547.html
EXCEL総合相談所3 (1001)
http://pc.2ch.net/bsoft/kako/1004/10044/1004432306.html
EXCEL総合相談所2 (1001)
http://pc.2ch.net/bsoft/kako/986/986283001.html
EXCEL総合相談所2 (0905)
http://mentai.2ch.net/bsoft/kako/986/986283001.html
EXCEL総合相談所 (0925)
http://mentai.2ch.net/bsoft/kako/965/965792827.html

62 :名無しさん@勉強中 ★ :07/08/27 00:41:35 ID:???
おまけメモ

2ch 技術系過去ログ置き場
http://ir9.jp/prog/ayu/datlog.htm

これ、この板では初出じゃないかな
>>60のは再出だけど
以下再掲

過去ログ @OURS-2ch過去ログ倉庫
http://lib.ac.la/2ch/read.php/pc8/bsoft/b1

63 :名無しさん@勉強中 ★ :07/08/27 01:09:04 ID:???
という訳で
依頼させて頂いたです

http://bbs.2ch-library.com/test/read.cgi/main/1142189971/165-

64 :名無しさん@勉強中 ★ :07/08/27 01:27:20 ID:???
メモ
携帯用googleプロキシ

http://www.google.co.jp/gwt/n?u=http://www.geocities.jp/mirrorhenkan/

65 :名無しさん@勉強中 ★ :07/08/27 12:17:33 ID:???
エクセルテンプレート無料ダウンロード サイト EXCEL Free
http://www.juno-e.com/
先生のためのEXCEL プログラム講座(漢読プリ編)
http://www.page.sannet.ne.jp/bbob/Prog/kcard/excel_kanyo.html

66 :名無しさん@勉強中 ★ :07/08/27 19:26:20 ID:???
何だかsnapshotにある
結構な数のスレッドが閲覧出来なくなってるっぽいですね。
何ギガ使っておられるのか判りませんが、容量が上限になったのかなと。

あちこち開いて確かめた訳じゃないですが

http://jane.s28.xrea.com/test/read.cgi/bbs/1180559017/368-370

を見て
そういえば

http://p2.chbox.jp/read.php?url=http://music7.2ch.net/test/read.cgi/musicjg/1157044946/all

みたいなものが最近かなりヒットするので。

67 :名無しさん@勉強中 ☆ :07/08/27 20:58:07 ID:npN1v28M
いきなり質問すみません。
その24のdat化の最新ってどうなっているのでしょうか?
変換ミラーのdat化方法から仕様が変わっていて変換できないのですが・・・

68 :名無しさん@勉強中 :07/08/27 21:11:41 ID:npN1v28M
あと、記載されてないその31もお願いします。

69 :名無しさん@勉強中 ★ :07/08/28 12:38:14 ID:???
>>67さん(「名無しさん@勉強中 ☆」って一体)
確かにdat化出来なくなってますね。
http://s.s2ch.net/test/---.uaY!FROM=&mail=&color=000000+efefef+0000FF+0000FF+FFFFFF&size=3&NG_NAME=&NG_MAIL=&NG_DATE=&NG_MESSAGE=/ex20.2ch.net/gline/1175735168/1-1001

http://yy14.kakiko.com/test/read.cgi/mirror/1158402994/606n
からコピペして変換すると
ポロポロ変換できない行が出てきますね。(レス23とか)

後で見てみるですが
申し訳ないですが夏だもので頭がとろけまくっている状態だもので
お急ぎなら本家htmltodatサポート板のほうで訊いてみて下さいです。
てか
手をつけたらぐああ状態になって後で自分が訊いちゃうかも

>>68
「read.cgi?7.00」でいいのではないでしょうか

70 :名無しさん@勉強中 ★ :07/08/28 18:09:38 ID:???
とりあえず暫定
http://s.s2ch.net/のdat化

URL例
http://s.s2ch.net/test/---.uaY!FROM=&mail=&color=000000+efefef+0000FF+0000FF+FFFFFF&size=3&NG_NAME=&NG_MAIL=&NG_DATE=&NG_MESSAGE=/ex20.2ch.net/gline/1175735168/1-1001

正規表現
m#(?:<form action=i>|<br><br>)([0-9]+):<font color=forestgreen><b> ?(.+?) </b></font>(?::([^/]+?))?:(.+?)(?: |\(\d+\))?<br>(.+?)(<br><br>)#mik

前処理
s#<a href="http://be\.2ch\.net/test/p\.php\?i=(\d+).+?</a>(.+?)(<br>)#BE:$1-$2 $3#ig

変換結果式
メール欄逆転

後処理
s#(\n[^<]*?)<a.+?>(\d+)</a>#$1$2#igk


とりあえずこれで欠けはなくなるかも。
上の例だとプレビューでレス14の名前にアンカーリンクがついてますが
やっつけで後処理をつけてアンカー削除したので
datにはついてないと思うです。

あと、be付きの書き込みの発言回数が残っちゃってる(レス2とか)のですが
前処理で何とかなりそうですが
頭痛が痛いので今日はこれにて

風邪薬買って飲んで寝ます

71 :名無しさん@勉強中 ★ :07/08/29 19:06:47 ID:???
Excelスレの過去ログ倉庫を作って頂いたです
ありがとうございます

2chスレの過去ログ倉庫作ります
http://bbs.2ch-library.com/test/read.cgi/main/1142189971/172

Excel総合相談所
http://request2.2ch-library.com/bsoft/excel.html

で、早速dat化しようとしたのですが
DAT2HTMLバージョン0.34で作成したファイルが(少なくとも今回のhtmlでは)
今までのものとだいぶ変わってるみたいですね。
例えば下記

Excel総合相談所 58
http://request2.2ch-library.com/bsoft/pc11.2ch.net/bsoft/1183791959.html

正規表現ですが
「DAT2HTML0.26」ではマッチしなかったので
下のように書き換えてみたです
(「行が長い」との事なので2行に分けてます)

m#<DT>(?:<A.*?>)?([0-9]+).+?(?:<A HREF="mailto:(.+?)">)?<b>(.*?)</B>(?:</A>|</FO
NT>|</a></font>) ?:(.*?)(?:<br>)?<DD>(.*)(<BR><BR><dt>|<br><br></dl>)#mik

冗長?
変換出来りゃそれでいいじゃないか(なみだ目)

いちおう今までのDAT2HTMLのバージョンとも互換性があると思うですが
さてどうなんでしょ
be付きの書き込みが無さそうなのでこれで確定とも言い切れないですけど。


ところで こういう事って
htmltodatサポート板のほうにもマルチポストしたほうがいいのでしょうか。
最近 ここ以外での書き込みをするのって 何だか怖じ気づいちゃってるですが。

72 :名無しさん@勉強中 ★ :07/08/29 21:34:20 ID:???
メモ

areaai - ai thread
http://areaai.mine.nu/
2chブラウザでも読める愛スレ過去ログ
http://areaai.mine.nu/2ch/

URLからいってダイナミックDNSを使った自宅サーバなのかなと思ったのですが
気になったのは下記

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
・ 負荷が多いと消されるおそれがあるので、出来るだけ2chブラウザを使ってください。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


> 負荷が多いと消されるおそれがあるので
とかかれているという事は
管理人さんの自宅サーバではないという事なのでしょうか

73 :名無しさん@勉強中 ★ :07/08/30 08:05:12 ID:???
DLしてdat化したです

あと面倒なので(それとサイズ圧縮の為)
>>61もhtmlをDLしてdat化しようとしたのですが
正規表現が「sample」だったり「DAT2HTML0.26」だったり「DAT2HTML0.26その2」だったり
色々だったです

例えばこれ↓とか

EXCEL総合相談所15 (1001)
http://pc5.2ch.net/bsoft/kako/1057/10577/1057720306.html

sampleでも駄目
DAT2HTML0.26でも駄目
ソースを見て
DAT2HTML0.26その2で
やっとマッチしたです

74 :名無しさん@勉強中 ★ :07/08/30 08:28:39 ID:???
という訳で
整理し直してアップしてみたです

http://www2.atpages.jp/mirror/2ch/excel/
http://wing2.jp/~mirrorhenkan/2ch/excel/

現在usamimi.infoは何故かFTPが繋がらないので後日
残り19-21も>>60で書いたミラーからdat化して追加しますか
正規表現は下ので多分良いでしょうし

http://yy14.kakiko.com/test/read.cgi/mirror/1114936246/507-517n

75 :名無しさん@勉強中 ★ :07/08/30 18:16:04 ID:???
usamimi.infoにも追加

http://usamimi.info/~mirrorhenkan/2ch/excel/

あと19-21もdat化して追加
正規表現は上で出した過去スレので十分でした

76 :名無しさん@勉強中 ★ :07/08/30 18:40:08 ID:???
>>70をやってみたのですが
元htmlのIDの発言回数の数字が表示されなくなっている感じですね。

という事は
讃岐メニューのdat化については
>>70のものでいいのかな。

77 :名無しさん@勉強中 ★ :07/08/31 12:24:22 ID:???
paper-view
http://paper.s37.xrea.com/
http://bomb-ch.hp.infoseek.co.jp/

Johnny's@2ch
http://j2ch.s32.xrea.com/

78 :名無しさん@勉強中 ★ :07/08/31 15:03:47 ID:???
http://usamimi.info/~mirrorhenkan/2ch/excel/read.php/1119886079/381-382n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
382 hoge ◆hoge//WRxY [ 2005/07/09(土) 00:59:11 ]

Sub URLをリンクに変換()
 Dim Rng As Range
 For Each Rng In ActiveSheet.UsedRange
  If Left(Rng.Value, 7) = "http://" Then _
  ActiveSheet.Hyperlinks.Add Anchor:=Rng, Address:=Rng.Value
 Next
End Sub

セルの値の左から7文字が"http://"なら、そのセルにリンクを設定します。
使い方は「ツール > マクロ > マクロ」で、
「マクロ名」に「URLをリンクに変換」とでも入れて、(他の名前でも可)
「マクロの保存先」で「PERSONAL.XLS」を選択して「作成」ボタンを押す。
表示されたVBEに上記コードを貼ってVBEを閉じる。
あとは、「ツール > マクロ > マクロ」から、先ほど登録した名前を選択して「実行」
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

79 :名無しさん@勉強中 ★ :07/08/31 16:11:52 ID:???
http://pc8.2ch.net/test/read.cgi/tech/1105108229/315

80 :名無しさん@勉強中 ★ :07/08/31 19:00:40 ID:???
いやいやExcelすげーよすげー。
VBE使ってフォーム作成とかすると
例えばDelphiで作ったみたいなツールも出来そうじゃないですか。
Web上のファイルを保存加工とかも出来ますし
その上で必要な正規表現も余裕で可能ですし(VBScript呼び出しが必要ですが)
何とバイナリファイルの作成や結合も出来るみたい。
まあExcelではなくwindowsのAPI(?)を呼び出して使ってるんでしょうけど。


知ってる人には当たり前の事なんでしょうけど
目からウロコ状態です

81 :名無しさん@勉強中 ★ :07/09/02 13:29:34 ID:???
http://pc11.2ch.net/test/read.cgi/software/1172927937/417
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
本文中のアンカ">>754"とか、名前欄に入れたレス番号にマウスオーバーすると、
そのレスがポップアップ表示されるのがよくある機能だけど、

その逆で、「ある番号のレスをアンカーしているレス」を表示する機能。
そうすれば、自分のカキコに対して誰がどんな反応を返しているのかがパッとわかって、探す手間が減る。
まあレス番号で検索すればいいんだけどさ。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

公式p2なら「逆参照」がそれにあたるなと。

ただ

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ちょっと思いついた機能を振ってみる。
専用ブラウザの話題を扱ってるスレで、そこそこ活気があるならどこでもよかったんだけどさ、
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

何故 細く長く続いてはいても発展は望めないスレッドに書き込んだんでしょうか。
他の専用ブラウザスレにも同内容で書き込んでいるのかな。

82 :名無しさん@勉強中 ★ :07/09/02 16:03:51 ID:???
>>70>>76の件ですが
やはり同一ID書込数は消されたのかな

【s2ch】讃岐メニュー【2mm】
http://hobby9.2ch.net/test/read.cgi/chakumelo/1138065601/719
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
719 名前:携帯電話情報通知しません[sage] 投稿日:2007/08/28(火) 23:39:58 ID:DdMLuBkwO
讃岐タソ…同一IDでの書き込み数表示、取っちゃったのね
けっこう便利だったのに(´・ω・`)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

だとしたら
讃岐メニューのdat化は
>>70ので問題ないのかも

83 :名無しさん@勉強中 ★ :07/09/03 19:30:15 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1175735168/758-762n

うーむ

2ch-imodeのスレッドのdat化を
もう少し簡単に出来るように考えてみますか。
>>44の件を敷衍すれば良さそうです

ただ思うに
その程度のスクリプトなら
誰か他の人がとっくにやってるんじゃないかと思ってしまうんですが
誰もやってないんですかね。


上から目線みたいで何か自分でもイヤになってしまうですが
ほんと 私が出来る程度の事なんて
誰でも出来る事だと思うんですよ。
何だかんだ
私が無理にやる必要があるのだろうかと。

誰か ヌケガケしてみませんか?
神になるチャンスですぞ

84 :名無しさん@勉強中 ★ :07/09/03 21:14:40 ID:???
ところで今日は
xreaのサイトの負荷が
いつもの5倍くらいあるみたい

http://www.geocities.jp/mirrorhenkan/others/photo/xrea_panel_20070903.png

何かあったのかな
消されたらどうしよう

85 :名無しさん@勉強中 ★ :07/09/04 19:03:58 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1175735168/760-768n

何方か存じませんが(764は私ではないです こんな時間は夢の中^^;)
情報どうもです

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
お教え頂いた正しい正規表現↑で100ファイルの一括変換を試してみると、大部分で成功、
でも、
1001-1010.niだけは変換失敗になり、それらをリスト作成→結合すると、
レス番号1001だけが欠けたdatが出来上がりました。何かを間違ったのかも…?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

という訳で
>>19の正規表現ではレス1001がマッチしなかったですね。
下記に変更すればいいのかな

(before)
m#<p>\[([0-9]+):(.+?)(?:≪(.+?)≫)? \((.+?)\) <a href=".+?">AA</a>\]<br> +?(.+?)</p>.*?<hr>(<p>|<a)#mik



(after)
m#<p>\[([0-9]+):(.+?)(?:≪(.+?)≫)? \((.+?)\)(?: <a href=".+?">AA</a>)?\]<br> *?(.+?)</p>.*?<hr>(<p>|<a)#mik


問題はそこだけだったみたいで
変換・結合出来て良かったです

86 :名無しさん@勉強中 ★ :07/09/05 07:54:54 ID:???
http://wannabe.fam.cx/index.cgi?mode=blog&page=1188911455

この前まで40くらいだったのに
何とも凄過ぎます

板の数って
syoboonさんのブログに書いてあったものだと
現在 隠し板を除いて628板あるみたい




メモ

【保管】アメリカのアニメの法則
http://wannabe.fam.cx/service/2ch_01/read.cgi?news4vip/1188901301/-100

87 :名無しさん@勉強中 ★ :07/09/05 19:28:43 ID:???
現在176板ですか(って暫時増えてるみたいだけど)
無理しないで下さいです


さて
これをURL変換するとしたら
別ページで行うしかなさそうです。
現状のURL形式だと それぞれの板によって条件分岐文を書かなければならないので
爆発的にスクリプト文が増えてしまうのです。
シンボリックリンクやDelegate等で一つに集約して頂けたら
同じフォーマットのURL変換書式で一元化出来るのですが。


とりあえず条件文がすごい事になりそうなので
URLデータを別途用意して
それをxmlhttpで読み込んで配列に格納するようにすれば
保守(?)が楽かも。

88 :名無しさん@勉強中 ★ :07/09/06 19:51:10 ID:???
メモ

Excel総合相談所 14
http://usamimi.info/~mirrorhenkan/2ch/excel/read.php?key=1055342774&st=605&to=607
Excel総合相談所
http://usamimi.info/~mirrorhenkan/2ch/excel/read.php?key=965792827&st=742&to=742
Excel総合相談所
http://usamimi.info/~mirrorhenkan/2ch/excel/read.php?key=965792827&st=756&to=756

7.11 IEオブジェクトを作る(IE7編) - VBScript & JScript(JavaScript) Tips for WSH
http://www.happy2-island.com/vbs/cafe02/capter00711.shtml
HTAでこんなん作ってみました
http://pc3.2ch.net/tech/kako/1013/10135/1013527404.html

89 :名無しさん@勉強中 ★ :07/09/07 19:10:21 ID:???
>>83の件
やったです

2ch-imodeのhtmlをdat化する試み
http://www.geocities.jp/mirrorhenkan/2ch-i/

スクリプトを実行するだけで
分割されたhtmlを取得結合してくれると思うです。
あとはこれをhtmltodatにで変換するだけと。
まあwshだもんでwindows限定になってしまうですが
htmltodatを含め ほとんどのツールがwin限定なので
仕方ないけどごめんなさいという事で。

というか 話がズレますけど
こういう事やってると
クロスブラウザとかいう事を通り越して
クロスOS(win/Mac/Linux)とか携帯対応とか
そんな所まで考えてしまうんですが
果たして上手くいってるんでしょうか。
マック板やLinux板・携帯板でもちょくちょく挙げられてるみたいですけど。

閑話休題

何というか
ミラーに全レス残っているのに
「かちゅ〜しゃdatでお願いします」とかいうのが頻繁だったり
「snapshotにありますがdatが欲しいのでお願いします」とかだったり
そういうのって今まで何とも やるせなかったんですが
2ch-imodeも全く同様だったので。

正規表現その他は>>90にて

90 :名無しさん@勉強中 ★ :07/09/07 19:14:54 ID:???
メモ
2ch-imode(http://2ch-i.net/)のdat化について

正規表現
m#<p>\[([0-9]+):(.+?)(?:≪(.+?)≫)? \((.+?)\)(?: <a href=".+?">AA</a>)?\]<br> *?(.+?)</p>.*?<hr>(<p>|<a)#mik

前処理
s#(<title.*?): 2ch-imode(</title>)#$1$2#k
s#<SCRIPT language="JavaScript">.+?</SCRIPT></body></html>##igk

変換結果式
メール欄逆転

後処理
s#(\n.*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk


これで何とかなると思うです。
beリンクが出来ないですが、元のhtmlの段階から存在してないみたいなので
ごめんなさいという事で。

91 :名無しさん@勉強中 ★ :07/09/08 11:39:48 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1175735168/736-737n

上で挙げられていた
http://comic6.2ch.net/test/read.cgi/doujin/1109636743/
で試してみましたが、出来てますね。
これでも面倒だというのならまあしょうがないかなと。


で、dat化して一通り読んでみて
どうでもいい事なんですが下記

http://comic6.2ch.net/test/read.cgi/doujin/1109636743/967
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
967 名前:名無しさん@どーでもいいことだが。[sage] 投稿日:2005/05/20(金) 23:51:35 ID:W7t8Z0KS
鉄アレイの"アレイ"って本当は漢字で"唖鈴"って書くんだ。
そもそも英語の"Dumb Bell(ダンベル)"が喋れない、つまり「音の出ない鈴」って意味なんだ。
音が出ないってことは中がぎっしり詰まった鈴。
そんな塊(のようなもの)が両端についた物だから重たくてトレーニングに使えるだろうとネーミングされたわけだ。
で、直訳すると先述のような漢字になる。
でも"唖"って"おし"とも読んで、昔のコトバで「口がきけない」って言う意味がある。
だからこれは差別用語だろう、と自主規制が始まってから今みたいに「アレイ」って片仮名で書かれるようになったわけさ。

だからなんだ。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


何か本当っぽいですけど
本当なんでしょうか。
どうでもいい話なんですが。

92 :名無しさん@勉強中 ★ :07/09/08 16:24:34 ID:???
さて
98/Me環境でADODB.streamを使えるようにするには
5メガくらいのファイルをインストールしなければならないみたい
(ソースは忘れちゃった^^;)
それだけの為に
アンインストール不可能なモジュール(?)を入れるのも二の足を踏むです

で、BASP21だと容量も少なくて済むし
何より アンインストール可能みたいなので
この線で考えてみようかなと(何を)

BASP21 DLL
http://www.hi-ho.ne.jp/babaq/basp21.html

何をしたいかというと
画像等のバイナリファイルを
スクリプトでDL出来ないかというだけの事なんですが。

定評があるとはいえ 新しいものを入れるのはやはり躊躇するです


メモ
後藤真希ミュージカルチケット売れん(レス82)
http://tv.2ch.net/zurui/kako/1035/10359/1035987503.html
【array[1] = 】MortScript(レス69)
http://pc11.2ch.net/test/read.cgi/mobile/1172140262/69
システムトレーディング技術交換スレ(レス70)
http://money.2ch.net/stock/kako/1001/10017/1001767689.html

93 :名無しさん@勉強中 ★ :07/09/08 16:31:29 ID:???
デスクトップ2ch
http://www.2chsearch.info/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
デスクトップ2chはシステム故障のため長期間メンテナンスさせていただきます。
2007.9.6
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

94 :名無しさん@勉強中 ★ :07/09/08 17:48:29 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1175735168/794n-

795・797は自分ですが
これ以上は何とも。


次はmakimo.toさんの携帯用htmlのdat化ですかね。
「鉄は熱いうちに打て」ともいいますし
何より
覚えているうちにやんないとスクリプト忘れちゃいますし。

95 :名無しさん@勉強中 ★ :07/09/08 18:58:31 ID:???
http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1164941934/388-389

MakeExeですが
XP/2000のみ対応との事で
私のクラシック環境では使えない事になっているようです。
とかいってやってみたら使えるかもしれませんが
万が一マシンが爆発でもした場合でも誰も責任とってくんないと思うので
私はやめとくです。
何だかんだいっても
ソース不明のexeファイルってやっぱり何だか怖い感じがしますし
仕様変更による微修正とかに都度対応とかも大変ですし。

というか前スレ362も書いたですが
コンパイルせずとも実行出来るものなら
わざわざ隠す事もないじゃないかいなと。
私もあちこちのソースを見て勉強させて頂いてるですし

96 :名無しさん@勉強中 ★ :07/09/08 22:43:43 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1175735168/799

良かったです

97 :名無しさん@勉強中 ★ :07/09/08 22:53:16 ID:???
現在314板ですか
すごいや母さん


それにしても
「あまたのよ」さんってあちこちで見ますね。

http://wannabe.fam.cx/index.cgi?mode=blog&page=1189160244
http://syoboon.asks.jp/65010.html




この方が書かれた下記エントリーがあってから
ばーっと広まった印象があるですよ

2ちゃんねる旅行記 にくちゃんねるのdatをDLするツール公開
http://amatanoyo.blog16.fc2.com/blog-entry-1017.html


・・・まあいいや。

98 :名無しさん@勉強中 ★ :07/09/09 01:09:10 ID:???
メモ
画像ファイルを読み取り
16進数にするフロー

1) クリエイトオブジェクトメソッドでファイルシステム
  オブジェクトを作成。

2) 1)で作成したオブジェクトのゲットファイル
  メソッドでファイルを指定

3) オープンアズテキストストリームメソッドで
  ファイルを開く。

4) 3)で取得したオブジェクトのリードライン
  メソッドにより、テキストを取得

5) ミッド関数で 4)で取得した文字列を一文字ずつ
  取得しながら、

 5−1) アスクB関数でアスキー文字(10進)を取得

 5−2) ヘックス関数で5−1)で取得した文字を
     16進に変換。

99 :名無しさん@勉強中 ★ :07/09/09 11:23:11 ID:???
スクリプト更新したです(カッケー!)

二つほどミラーを追加して
プレビュー版・非プレビュー版・別窓各版とも表示その他 統一させるようにして。
ソースも1500行超えてしまったですか。


あと

341板ですか。


考えてみるです

100 :DinoSwift :07/09/09 23:40:23 ID:hyFCUTig
質問なんですけど、いまこんな感じでクローラを巡回させてるんですが
http://wannabe.fam.cx/service/task.txt
http://wannabe.fam.cx/service/list.txt

専門カテゴリの巡回頻度が12時間とかになるとやっぱ取りこぼしが増えますかね?
あんまり他のカテゴリをうろつかないんで、どれくらいでdat落ちするのか感覚的によくわからんのですが。
本当は4時間毎、最悪でも6時間ごとに取得にしたかったんですが100カテゴリ巡回するのも1時間以上かかって
どうも無理っぽいんです。
この前の改造でパソの負荷そのものは抑えられたものの、やはりADSL回線でのDLの速度がネックになってるの。


(へ´ω`) 他の過去ログ倉庫とかやっているひとってどういう風にクローラ動かしているかとか
      知っている人いないですかね。

101 :名無しさん@勉強中 ★ :07/09/10 19:38:13 ID:???
うーむ

>>100
技術的な問題というよりも、実践的なそれだと思うので
同様な事をやっておられた方に訊いたほうがいいと思うです。

とりあえず
みみずんさんだと

ご意見ご質問ご要望をどうぞ(その2)
http://jbbs.livedoor.jp/bbs/read.cgi/computer/682/1144317464/329
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
329 名前:みみずん[] 投稿日:2006/11/06(月) 03:54:00 ID:65YXQi4o
巡回に2,3日かかるのでその間に
書き込み〜dat落ち
になってしまった場合はデータ取得ができずに検索に反映されないことがあります。

こればかりはどうしようもないです。。。
頻繁に取得しているのはロビー、ニュース速報、VIPだけです。この板は取りこぼしは少ないはずです
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


ただ、みみずんさんには実に実に失礼ですが

> 巡回に2,3日かかるので

との事ですし
正直取りこぼしが多いので 以下略
ごめんなさい

102 :名無しさん@勉強中 ★ :07/09/10 19:55:12 ID:???

2chミラー計画(http://web.archive.org/web/*/http://fun.kz/)では
取りこぼしも少なかったのですが
管理人のMoonWolfさんの書き込みを前に見たですが

http://yy14.kakiko.com/test/read.cgi/mirror/1115123243/228-232n

関係ありそうな件を引用すると

http://devlog.moonwolf.com/200402.html
http://devlog.moonwolf.com/200422.html

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
2004-04-02
_ [Ruby][Net] 2ちゃんねるミラー計画
のWeb::Agentを使って2ちゃんねるの.datを根こそぎ引っこ抜くプログラムを組んだ。
SmartFilterで引っかかってテスト出来ないけど、多分動くはず(^^;
_ If-Modified-SinceとかRangeとかAccept-Encoding: gzipを使って転送量を抑えるようにしてみた。
今3Mbpsくらいの回線を使ってるけど、2ちゃんねる全体の取得ってどれぐらい時間がかかるんだろう?
4時間以内で終わるなら、毎日cronで処理したいなぁ。
_ 前に作ったWebクローラーを流用してRindaによる分散処理に対応させてみた。
1プロセスで1つの板を処理するようになっている。8並列くらいにすれば帯域をフルに使えるだろう。
_ 初回は全部GETだから時間がかかるだろうな。でも2回目以降は差分取得で早く終わるだろう。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
2004-04-04
_ [Ruby][Net] 2ちゃんねるミラー化計画
全部で15GBくらいでした。スレッド数は25万スレッド。
2度目の巡回だと、1板あたり5〜10分で巡回できている。8並列だから10分で8板というところです。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
2004-04-22
_ [Net] 2ちゃんねるを会社から読もう。
fun.kzサーバでsubject.txtおよび*.datを公開しました。
板一覧の*.2ch.netをfun.kzに書き換えるだけで2ちゃんねるブラウザからアクセス可能です。
ただし、日中の更新は2時間おきで50レス以上増えたスレだけが更新されます。夜間に手動で1度だけ全スレッドの更新をしているので1日古い情報が表示されるかもしれません。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

という所でしょうか。

103 :名無しさん@勉強中 ★ :07/09/10 20:14:08 ID:???
実に久しぶりに読んでたんですが

http://devlog.moonwolf.com/20040414.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
[Ruby][Net] 2ちゃんねるミラー計画
全板の全スレッド対象で取得だと、すぐに規制になりそうなので条件を絞り込んだバージョンを作ってみた。
1プロセスのみ。前回取得時から20レス以上増えていること。もしくは950レス以上で前回取得時より増えていること。
この条件でアクティブなスレッドは、ほぼ網羅できるしdat落ち寸前の物も救える。
これを1日4回くらいcronで流して、1日1回だけ全スレ取得を実行するというのはどうだろう?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


実行されたのかどうか判りませんが

> 前回取得時から20レス以上増えていること。
> もしくは950レス以上で前回取得時より増えていること。

素人目にも、これをやるだけで
取りこぼしが少なくなるように思えたです。

104 :名無しさん@勉強中 ★ :07/09/10 20:26:43 ID:???
という事で、繰り返しになるですが

>>103
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
前回取得時から20レス以上増えていること。
もしくは950レス以上で前回取得時より増えていること。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

>>102
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
日中の更新は2時間おきで50レス以上増えたスレだけが更新されます。
夜間に手動で1度だけ全スレッドの更新をしているので1日古い情報が表示されるかもしれません。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


のどちらかを行うようにすれば
もしかしたら巡回がかなり短縮されるのかもしれないかもしれない
と思ったりしたです

ごめんなさい(←?)

105 :名無しさん@勉強中 ★ :07/09/10 21:01:42 ID:???
あと
23ch.infoさんの所が
もしかしたら一番DinoSwiftさんの所に近いのかもです
クロール形態やスレタイ検索等で。

http://www.23ch.info/

ただ、此方のdat2htmlは
IEでは問題無いのですが
Bagelだと「html変換」のボタンが押せないみたい
って関係ないですが^^;

106 :名無しさん@勉強中 ★ :07/09/13 19:53:36 ID:???
メモ
公式p2携帯用URL書式

http://p2.2ch.net/p2/read.php?host=wwwww.2ch.net&bbs=news4vip&key=1189602457&rc=383&b=k

107 :名無しさん@勉強中 ★ :07/09/14 19:53:16 ID:???
MoonWolfさんのお名前が出たので
関連という事で

制服兵器兵站局 - FrontPage
http://mil.homeip.net/

上 半角二次元板の統合美少女兵器スレのまとめサイトなんですが
過去ログにMoonWolfさんの作られたdat2htmlを使っておられました

陸海空兵器少女第一五造兵廠
http://mil.homeip.net/kako/1161794969.html

スクロールして右下を見ると

−−−−−−−−−−−−−−−−−−−−−−−−−−−−
dat2html.rb 0.1 Converted.
http://www.moonwolf.com/ruby/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

という事で
これをdat化する正規表現は下記でいいのかな

正規表現
m#<dt.*?>([0-9]+).+?<b>(.+?)</b>(?:</font>|</a>)(?: メール:(.+?))?投稿日:(.*?)<dd> ?(.*?)<br><br>(<dt.*?>|</dl>)#mik

変換結果式
メール欄逆転

108 :名無しさん@勉強中 ★ :07/09/16 15:23:28 ID:???
メモ

idol.bbspink.comがハードウェア障害|管理人室 - 寝取られまとめ気味サイト
http://ntr.jpn.org/admin/log/eid10.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
BBSPINKの「エロゲー」「エロゲー作品別」などが収容されているidol.bbspink.comサーバが
ハードウェア障害で動作停止中の模様です。

PINKサーバダウン・復旧情報スレッド
http://pie.bbspink.com/test/read.cgi/erobbs/1189701121/l50
pink秘密基地 質問・雑談スレッド10
http://pie.bbspink.com/test/read.cgi/erobbs/1189087905/l50
pink秘密基地 質問・雑談スレッド11
http://pie.bbspink.com/test/read.cgi/erobbs/1189703678/l200

HDDの冷却用FAN故障によるハードウェア障害とのこと。80GBのHDD2台構成(notRAID)で
OS側がご臨終した様子。なんとなく長期化しそうな感じがしないでもないです。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

109 :名無しさん@勉強中 ★ :07/09/16 15:34:57 ID:???
CodeZine:Pythonを始めよう(入門, Python)
http://codezine.jp/a/article/aid/1617.aspx

110 :名無しさん@勉強中 ★ :07/09/16 17:39:14 ID:???
さて
makimo.toさんの所の携帯用htmlをdat化しようとしてるんですが
正規表現がよくわかんないです。

メール欄の位置がこれまた独特で
メール有り無しどちらでもヒットするようにさせようとすると何だか変になっちゃうもんで
やむなく前処理と後処理で何とかしようとしたんですが
識別にIDを絡めたのが災いしてID無しの板ではヒットしないです。

ID有り無しのどちらでもヒットするようにしたいですし
2ch/bbspinkのスレッドはmakimo.to:8000/i内に変更されてますし
2ch以外のURLはgoogleの携帯プロキシを経由するようにリンクされてるんですが
それらも元に戻したいですし。
いや まったくもって難しい。
簡単な人には実に簡単なのでしょうけど。



こんな事して何の意味があるのか と自問自答してしまいますが
ほんと 何やってるんでしょうね。

111 :名無しさん@勉強中 ★ :07/09/16 18:37:09 ID:???
メモ
htmltodatサポート板への投稿文

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
御返事遅れて申し訳ないです
>>471のページの方法で何とかなったと思うです。

さて、早速なのですが
下記3つのhtmlにマッチする正規表現を教えて頂けないでしょうか。

http://mirror.sarashi.com/htmltodat/1187190494.html
http://mirror.sarashi.com/htmltodat/1165245437.html
http://mirror.sarashi.com/htmltodat/1137198532.html


メール欄が日付(+ID)の右にあり、どうもマッチしないです。
下のような正規表現を考えてみたのですが

正規表現
m#<hr>([0-9]+):(.+?):(.+?)(?:\[(.+?)\])?<br>(.*?)(<hr>)#mki

変換結果式
$2<>$4<>$3<>$5<>

メール欄が無い場合にはマッチしないのです。
どこがよくないのでしょうか?

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

112 :名無しさん@勉強中 ★ :07/09/16 18:40:39 ID:???
>>111の文章をhtmltodatサポート板に投稿しようとしたのですが
何度やっても


--------------------
書込み中・・・
--------------------
ERROR!
ERROR!

NGワードが含まれています。
したらば


・・・というメッセージが出て
投稿出来なかったです。
「したらば」という文字も書いてないですし
よくわかんないや

という事で、此処に書いておくです。

113 :名無しさん@勉強中 ★ :07/09/16 18:54:36 ID:???
投稿出来たです
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/475-476

IEから投稿してみたら
単に「NGワードが含まれています」というだけだったので
試しにURLの一部を変更してみたら投稿出来ました。
で、URLで伏せ字にした単語がNGワードなのかなと
476で投稿してみたら投稿可能だったので
結局よくわかんないです

もしかして嫌われたのかな、とか思ったりして。

114 :名無しさん@勉強中 ★ :07/09/18 18:25:27 ID:???
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/480

ありがとうございます。

という事で
とりあえずの出来上がりという事で。

mobile29chの携帯用htmlをdat化する試み
http://www.geocities.jp/mirrorhenkan/makimo-i/

正規表現その他は>>115にて

115 :名無しさん@勉強中 ★ :07/09/18 18:31:57 ID:???
http://makimo.to:8000/i/にある携帯用htmlのdat化について

正規表現
m#<hr>([0-9]+):(.+?):(.+?)(?:\[(.+?)\])?<br>(.*?)(<hr>)#mki

前処理
s#(<title>)29-(.+?</title>)#$1$2#ik
s#<a href=/i/d.cgi/.+?>(.+?)/(2ch\.net|bbspink\.com)/(.+?)/(\d+?)(/.*?)?</a>#http://$3.$2/test/read.cgi/$1/$4$5#igk
s#<a href=http://www\.google.+?>([^h\&].+?)</a>#http://$1#igk
s#<br><font color=\#000080>▼\d\d/\d\d/\d\d\(.\) \d\d:\d\d</font>##igk

変換結果式
$2<>$4<>$3<>$5<>

後処理
s#((?:^|\n).*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk


これでdat化出来るかも。
beリンクは元から付いてなさそうなので出来ないっぽい。
あと、AA等で使われる全角スペース+半角スペースや連続改行等も
省略される感じなので、表示がうまくいかないかも。

116 :名無しさん@勉強中 ★ :07/09/18 18:45:13 ID:???
mukiyuさんも此処を御覧になられておられるようなので
htmltodatサポート板へのマルチポストはやめとくですが
本当にありがとうございました。

ふと思ったんですが
>>90の2ch-imodeの後処理ですが

s#(\n.*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk

これだとレス1の名前のトリップがマッチしないっぽいですね。
なので>>115のようにしてみたですが
さてこれで良いのかどうか。


同様に

http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/477
−−−−−−−−−−−−−−−−−−−−−−−−−
 (略) とりあえず変換結果式を使わず後処理で
s#(.*?)<>(.*?)<>(.*?)<>(.*?)\n#$2<>$3<>$1<>$4\n#igk
−−−−−−−−−−−−−−−−−−−−−−−−−

これだとレス1がマッチしなさそうに見えたのですが
やってみたら変換出来たので
実はマッチしてるんでしょうか。

まだまだ勉強が必要なようです。

117 :名無しさん@勉強中 ★ :07/09/18 18:48:47 ID:???
さて
DinoSwiftさんの所
更に巡回板をお増やしになられたので
追随させて頂いたです

現在443板ですか。

118 :名無しさん@勉強中 ★ :07/09/18 20:39:42 ID:???
jane外部コマンドスレより

http://jane.s28.xrea.com/test/read.cgi/bbs/1180559017/506
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
みみずんから以下のログが取得できません

OSを再インストールする前に決意を書き込むスレ
http://pc2.2ch.net/test/read.cgi/win/1015184988/
mimizun.com:81/2chlog/win/pc2.2ch.net/win/kako/1015/10151/1015184988.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

「mimizun.com:81」って事は
php版のスクリプトソースを見てやってるのかなと。


それよりも不思議に思ったのは

http://mimizun.com/2chlog/win/pc2.2ch.net/win/kako/1015/10151/1015184988.html

は表示出来るのに(存在しているのに)

mimizun.com:81/2chlog/win/pc2.2ch.net/win/kako/1015/10151/

のほうにはリストとして上のスレが出ていない事で。
そういうのってもしかしたら結構あるのかな?

みみずんさんに訊いたとしても
「リスト漏れですね」で終わる話でしょうし
まあそれだけの話です

119 :名無しさん@勉強中 ★ :07/09/18 20:40:50 ID:???
訂正

mimizun.com:81/2chlog/win/pc2.2ch.net/win/kako/1015/10151/



http://mimizun.com/2chlog/win/pc2.2ch.net/win/kako/1015/10151/

120 :名無しさん@勉強中 ★ :07/09/18 20:42:44 ID:???
さらに追記

上のスレッドのdatは

http://mimizun.com/2chlog/win/pc2.2ch.net/win/kako/1015/10151/1015184988.dat.gz

に存在してるみたい

121 :名無しさん@勉強中 ★ :07/09/19 07:22:18 ID:???
さらに追随
現在588板ですか。

あと120板ですね。(←決してけしかけている訳では)

122 :名無しさん@勉強中 ★ :07/09/19 17:34:47 ID:???
o2onスレに行ってみたら

http://tmp6.2ch.net/test/read.cgi/download/1182086100/427-438n

まさしくそのものズバリのものを作って出してるですが
いざ話題にされてると怖いものがあるです

438のようなものもやれば出来ると思うですけど
やらんとこ

123 :名無しさん@勉強中 ★ :07/09/19 21:42:11 ID:???
上の436を見てアラスカ板に行ってみたら
同趣旨のスレッドが立てられているんですね。
うまい事機能しているみたい

DAT屋
http://snow.2ch.net/test/read.cgi/alaska/1188620894/

124 :名無しさん@勉強中 ★ :07/09/21 13:33:54 ID:???
メモ

2ちゃんねるログ保管予約
http://2ch.bluesvirus.com/
−−−−−−−−−−−−−−−−−−−−−
 予約しておくと自動的に過去ログを保存します。
−−−−−−−−−−−−−−−−−−−−−


9月14日から開始されたのでしょうか。

それにしても、すごいドメインだ。

125 :名無しさん@勉強中 ★ :07/09/22 14:49:10 ID:???
http://jane.s28.xrea.com/test/read.cgi/bbs/1180559017/510-516

これを見て 自分とこもそうなのかなと心配になったので調べてみたですが
無問題っぽいです。良かったー。
とかいって実は問題あるかもですが こればかりは教えて貰わない事にはわかんないです

ちなみに該当スクリプトは下記の3つですが
2番目のでしか試してないもので。

http://www.geocities.jp/mirrorhenkan/jane/datsearchgetjane/
http://www.geocities.jp/mirrorhenkan/jane/getdatpath/
http://www.geocities.jp/mirrorhenkan/jane/htmltodat-convert/

126 :名無しさん@勉強中 ★ :07/09/22 15:02:22 ID:???
そういえばこれ
getlog.wsfをプチハック(カッケー!)して作ったですが
エラーが出たら終了する処理を
JScriptのtry-catchでやっておられるのです。
自分とこのはVBScriptだもので
エラーが出たらエラー終了で何ともみっともないんですが

VBScriptでもtry-catchって出来るのでしょうか?

127 :名無しさん@勉強中 ★ :07/09/23 13:50:02 ID:???
台湾版が消えたみたい

http://home.kimo.com.tx/mirrortaiwan/

消えたというより
奇摩が免費網頁空間をやめたみたい。
上のURLから飛んだ先に色々書いてあるです。

96年7月31日に廃止されたとの事。
ここでいう96年というのは台湾の年号「民国96年」で
西暦2007年の事みたいです。
孫文が起こした辛亥革命の西暦1911年を「民国1年」と定めているみたいで
蒋介石が中華民国として統治していた頃の名残りなのでしょうね。

で、移転先なんですが
香港yahoo!
奇摩部落格
のどちらかを推奨してるみたい。

香港yahooは現在取得してあるので

http://hk.geocities.com/mirrorhonkon/

部落格かなと。

http://tw.blog.yahoo.com/


それにしても
ヴィヴィアン・スーさんも部落格をやっておられるのですか。

vivian的部落格
http://tw.myblog.yahoo.com/jw!mrlQmZyVFRlxMiby5AufoyiQY5rW

128 :名無しさん@勉強中 ★ :07/09/23 16:32:08 ID:???
>>6を実行してみました

youtubeのURLからflvファイルのリンクを抽出する試み
http://www.geocities.jp/mirrorhenkan/others/youtube/

こういうものって間違いなく誰かがもっと上等なものを作っているんでしょうが
自分が使うためだけに作ったものなので
誰も試さなくて結構です

129 :名無しさん@勉強中 ★ :07/09/23 17:06:50 ID:???
それと
変換したURLをDLツール等に入れた場合
>>6で書いたみたいに
ステータス302で別のURL指定になると思うので
そういうのに対応したツールでないと使えないかもです

130 :名無しさん@勉強中 ★ :07/09/23 18:24:54 ID:???
質問?ボコボコにしてやんよ!
http://bokoboko.dip.jp/bokoboko/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
9月14日20時から9月16日12時にかけまして大規模なサーバー障害が発生しておりま
した。本当に申し訳ありませんでした。現在ロボットの巡回も通常通り行っていますが、
この障害のあいだに落ちてしまったスレッドについては取得しそこねてしまいました。
こちらもあわせてお詫びいたします。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

やはり自動取得しておられたのだなーと。
レス表示もスクリプトで自動表示されておられるのでしょう。
すごいなー


ただ
収集用の単語に下のスレはヒットしなかったのかなとか思ったです
検索してもなさそうですし(ってそんなに見てないですけど)


ラノベ作家だけど、暇すぎるので質疑応答
http://wwwww.2ch.net/test/read.cgi/news4vip/1190298561/

131 :名無しさん@勉強中 ★ :07/09/24 11:33:02 ID:???
【され夫】妻がシャアシャアと不倫しおった!5【破局】
http://pantomime.jspeed.jp/test/read.cgi/monament5/dat/

上 文字化けしてますね。
ブラウザのread.cgiからも読み込めなさそうですし。

想像するに、DinoSwiftさんの所から文字コードEUCのdatをDLして
そのまま上げられたのかなと。

それと、ファイル名も「dat.dat」となってるっぽい。
http://pantomime.jspeed.jp/monament5/dat/dat.dat

パントさんほどの方なら
どちらもupload.phpで制御出来ると思うのですが。
数字以外のファイル名ならアップしないようにして
文字コードがShift_Jis以外の場合は
jcode.plなりJcode.PMなりjcode.phpなりでコード変換するなりして。

132 :名無しさん@勉強中 ★ :07/09/25 00:07:55 ID:???
IE7をお使いの方
下のをちょっと見て頂きたく。

iswebでのテスト
ttp://mirrorhenkan.hp.infoseek.co.jp/cgi-bin/xml/test/read.html#html/1160652610/l50

(直リンクではエラーが出るサーバなのでhを除けています)

上記スレッドですが
IE7では文字化けせずに
ちゃんと表示されとりますでしょうか?

何でも IE7ではFirefoxやsafariと同様な仕様になったそうなので。

133 :名無しさん@勉強中 ★ :07/09/25 20:56:51 ID:???
反応が無かったので(期待してなかったけど)
袖触れ合った雲の上の人に訊いてみたです

どうやら文字化けするみたいですね。
んもーIEって中途半端なんだからー。


という訳で、IE7ではxmlhttprequestが可能なのですが
Firefoxやその他のブラウザのようには出来ないみたい。

それと

> ただ、別件ですがIE7 on Vistaの保護モードを有効にすると、できないことが多少あります。

との事なので
自分が出している諸々のwshスクリプト
もう少し説明を加えたほうがいいのかもしれないなと思ったりして。

134 :名無しさん@勉強中 ★ :07/09/25 22:26:39 ID:???
メモ
mobile29chの最新30表示のURL書式

29-NHK教育テレビ・イタリア語会話スレッド7
http://makimo.to:8000/i/d.cgi/gogaku/2ch.net/academy6/1155157005/?i=30

「?i=30」をつければいいみたい

って見てみたら
全部表示も可能だったんですか。

135 :名無しさん@勉強中 ★ :07/09/25 22:35:55 ID:???
http://jane.s28.xrea.com/test/read.cgi/bbs/1180559017/524-525
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
524 名前:Jane使いの名無しさん[sage] 投稿日:2007/09/25(火) 13:34:45 ID:8QIC8i6s0
板にあるスレを全て開くって出来るようになりませんか?
初めて行った専門板でログから検索で知識を得たい時に、スレを1コ1コ開いていくのが凄まじく面倒なのです・・・。

525 名前:Jane使いの名無しさん[sage] 投稿日:2007/09/25(火) 14:11:34 ID:w6nI7T1G0
>>524
可能か否かって話なら"可能"ではあるけど
外部コマンドだけでは出来ないのでスレ違い
>>1の※を読んでね

もっともこういうことやるツールやスクリプトを公開すると
鯖への負荷を考えずに使い出す奴が必ず居るから
該当スレに行っても、まともな思考が出来る人は相手にしてくれないだろうけど

自分で知識を身に付けて、ひっそり作ってひっそり使うがよろし
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


「こういうことやるツールやスクリプトを公開」 している私は
いったいどうすればいいのでしょうか。
525さんにケチョンケチョンのパーにされそうですね。
ごめんな。ゆるしてけろ。

てか「ひっそり作ってひっそり使う」どころではなく
変換スクリプトで1週間以内の実況スレを検索時
強制的に該当スクリプトをDLさせるようにしているんですが
どうなんでしょう、実際に使ってる人 居るのかな。

それにしても
すっかり過疎スレになったもんだ。>dat落ちhtml変換スレ

136 :名無しさん@勉強中 ★ :07/09/26 10:13:47 ID:???
メモ

ブラウザで判別して処理を振り分けようとしているのですが
UserAgentを見て判別するようにすると
proxomitronやFirefox(知らないけど)等のUA偽装で難なく騙されて(?)しまうので
別の方法が無いかなと。

探していたら、とほほさんの所で
「navigator.appName」というのがあったのですが
これ もしかしたら使えるかな?

適当にやってみたのがこれ
−−−−−−−−−−−−−−−−−−
<script>
var ua=navigator.userAgent;
var ua1 = navigator.appName;
alert(ua);
alert(ua1);
document.write(ua+"<br>"+ua1);
</script>
−−−−−−−−−−−−−−−−−−

IEだと
−−−−−−−−−−−−−−−−−−−−−−−
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)
Microsoft Internet Explorer
−−−−−−−−−−−−−−−−−−−−−−−

と出ますが

Gecko系ブラウザ(Bagel)でUAをIEにしてやってみた結果が
下記
−−−−−−−−−−−−−−−−−−−−−−−−
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)
Netscape
−−−−−−−−−−−−−−−−−−−−−−−−


うまくいきそうじゃないですか。

137 :名無しさん@勉強中 ★ :07/09/26 20:56:12 ID:???
お伺いですが
下のURLは表示出来てますか?
IE6・Bagelでは問題無いです。

http://www.geocities.jp/mirrorhenkan/dat2html-9/html/dat/read1.html?key=1159620853

これ
IE7でも文字化けしないようにと
偉い人に色々伺って直してみたものなんですが。

138 :名無しさん@勉強中 ★ :07/09/27 17:55:11 ID:???
急に思いついたですが

http://mirrorhenkan.hp.infoseek.co.jp/cgi-bin/xml/html/

これ↑ 完成出来るかもしれない。

現状ではIE文字化けがどうにもならなかったのですが
何とかなりそうな感じですよ。
お力添え頂いたMVPの方に大感謝なのです

139 :名無しさん@勉強中 ★ :07/09/27 19:32:58 ID:???
メモ

Script雑感: Ajax:画像を取得して表示する(Firefox)
http://zombiebook.seesaa.net/article/34873787.html
[ajax] Firefox+overrideMimeType+text/plain=4KB制限 Kawa.netブログ(川崎有亮)/ウェブリブログ
http://kawa.at.webry.info/200511/article_17.html
k12uのアレ - 2006-12-16
http://d.hatena.ne.jp/k12u/20061216

140 :名無しさん@勉強中 ★ :07/09/28 18:46:07 ID:???
という事でやってみました。

ttp://mirrorhenkan.hp.infoseek.co.jp/cgi-bin/xml/test/read.html#html/1160652610/

IE6・Bagelでは文字化けしなくなったです。
ただ上のでも書いたですが
IEだと、メッセージアラートを出さないようにすると
データをうまく受け取れないのです。
色々考えてはみたのですが、さて難しい。
どこかで訊こうにも これってIE専の事なので
変な反応が返ってきそうですし。


それと
.htaccessを使って文字化け回避したものが下記

http://mirror.s151.xrea.com/0ch_html/mirror/test/read.html/html/1159620853/l50

どちらもIE7で問題無かったら
嬉しいです。

141 :名無しさん@勉強中 ★ :07/09/29 12:49:54 ID:???
投稿してみたです

http://pc11.2ch.net/test/read.cgi/php/1127896640/887

動作確認だけでも返事が欲しいところ。
まあ期待せずに待ってみますか。

142 :名無しさん@勉強中 ★ :07/09/30 14:47:37 ID:???
御返事頂きましたが
Firefoxでどうなのか教えて頂けたら嬉しいです


IEとそれ以外で処理を完全分岐するようにすれば
アラートを出さずとも出来るようになるかもですが
大変そうだなー。
でもアラート消したいんだよなー。

143 :名無しさん@勉強中 ★ :07/09/30 16:21:51 ID:???
なぜFirefoxの動作確認が欲しいかというと
下のエントリーを見たからで。

[ajax] Firefox+overrideMimeType+text/plain=4KB制限 Kawa.netブログ(川崎有亮)/ウェブリブログ
http://kawa.at.webry.info/200511/article_17.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Firefox を使っていて、さらに
req.overrideMimeType( "text/plain" )
とした場合は、responseText が先頭 4096 バイト(4KB)しか取得できないことが
分かりました。レスポンスの Content-Type ヘッダは通常通りですが、
responseText が途中で切られてしまいます。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

2年前の記事なので現在はどうなってるのかなと。


とはいえ、多分大丈夫じゃないかなとは思うです。
今年2月のエントリーですが

Script雑感: Ajax:画像を取得して表示する(Firefox)
http://zombiebook.seesaa.net/article/34873787.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
実際のところ、バイナリーデータであっても responseText で取得できる
んですが、ただ、そのまま使うと化けてしまうんですね。
始めは、置換したり削ったりと試行錯誤してましたが、諦めかけた頃この
記事を見つけまして・・・。非常にラッキーでした。

んで、どうやって解決しているかというと overrideMimeType です。こいつ
で強制的に指定してやれば良かったわけです。なーんだ。です。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


4kb制限の事には一切触れてないですし
実際サンプルは動作したです。

ただ、その画像が4kb未満なのかどうかとか調べてないので
甚だ心許ないんですが。

144 :名無しさん@勉強中 ★ :07/09/30 16:38:07 ID:???
お前がFirefoxを入れて試してみればいいじゃないかと言われそうですが
自分のPCのOSバージョンでFirefoxを入れると
アンインストール出来ないみたいなので控えてるです


メモ

[JavaScript] dataスキームURI生成(画像データのBase64変換)
http://www.kawa.net/works/js/data-scheme/base64.html
perl+javascript - IEでdata:スキームを有効に! 404 Blog Not Found
http://blog.livedoor.jp/dankogai/archives/50647744.html



上の見て思ったんですが
IEのstartDownloadビヘイビアって
画像等のバイナリファイルもDL出来るんでしょうか?

145 :名無しさん@勉強中 ★ :07/10/01 17:41:03 ID:???
覚え書き

http://www.geocities.co.jp/lauhangwoo/jane/

此方のsearchex.wsfなんですが、検索結果が常にIEで開いてしまうです。
最近はBagelばっかなもんで、そっちで開くようにしたいなと。


改造方法は二つ。

(1) スクリプト内でブラウザを決め打ち指定するようにする
(2) JANE2CH.iniにある「BrowserPath=*****」にあるもので開くようにする


どうせやるなら(2)でしょうね。

って
もしかして、そんな事しないでも出来るのでしょうか。

146 :名無しさん@勉強中 ★ :07/10/01 19:18:36 ID:???
メモ

Protocol Handlers for Microsoft Internet Explorer - misuzilla.org
http://www.misuzilla.org/dist/net/mphandler/
ドジっ子Watcher Dataスキームが使えるかどうかのテスト
http://blunderer.blog54.fc2.com/blog-entry-140.html
Dataスキームが使えるかどうかのテスト - スーパードジっ子Company
http://blunderer.web.fc2.com/datascheme/no2.html


IEでもdataスキームが使えたら面白いんですが。

147 :名無しさん@勉強中 ★ :07/10/01 19:21:53 ID:???
そうそう
DinoSwiftさん
全板制覇おめでとうございます(全部見てみた訳ではないですが)

709板ですか。
次はbbspinkですね(決してけしかけている訳では)

148 :名無しさん@勉強中 ★ :07/10/07 17:40:10 ID:???
前スレ673-684でのノートン誤反応の件ですが

アンチウイルスソフトによるスクリプトの誤反応について
http://www.geocities.jp/mirrorhenkan/others/norton/

上のURLを添えてwshの達人の方に伺ったところ


> Set FS=CreateObject("Scripting.FileSyst" & "emObject")
> とかやったらどうでしょう?試してないですがノートン先生ならスルーしてくれそうな予感です。


という御返事を頂いたです。
まだ試してませんがこれで良さそう。
getlog.wsfのように疑わしい単語を全角にするのよりも(やる側は)簡単ですし。

でも出してある奴を修正するのは面倒だなー。
まあ他にやる事が出来た時のついでにやるという事で。

以上
多分忘れるのでここにメモ

149 :名無しさん@勉強中 ★ :07/10/11 10:26:18 ID:???
メモ

IT戦記 - 一行で IE の JavaScript を高速化する方法
http://d.hatena.ne.jp/amachang/20071010/1192012056

すっげーな
レベルが違う

150 :名無しさん@勉強中 ★ :07/10/11 23:53:59 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1175735168/921

たった今気付いたのです
あまり無理せんといて下さいです



読めないdat陳列棚
http://takatyan.ddo.jp/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
datファイルの規則

http://takatyan.ddo.jp/datfiles/サーバー.2ch.net/板/鍵.dat

例:http://takatyan.ddo.jp/datfiles/that3.2ch.net/gline/1111192634.dat
HTMLの規則
HTML化はウェブブラウザからの要求時に逐次生成しています。可能な限り、datの参照にてお済ませください。

http://takatyan.ddo.jp/view_html.cgi/サーバー.2ch.net/板/鍵.dat

上記、「datファイルの規則」の「datfiles」を「view_html.cgi」に置き換えるだけです。例:http://takatyan.ddo.jp/view_html.cgi/that3.2ch.net/gline/1111192634.dat
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


変換スクリプトに入れる場合
プレビュー表示はdatで示せばいいのかな。
で、datが表示されていたら全部揃っているという事になるので
html表示のリンクを開けば良いと。

151 :名無しさん@勉強中 ★ :07/10/12 00:20:29 ID:???
読めないdat落ちスレのhtmlミラー作ります [85]
http://takatyan.ddo.jp/view_html.cgi/that3.2ch.net/gline/1111192634.dat

あったので 久しぶりに見てみたですが
読んでると 何とも落ち込むのう
つらいのう つらいのう ギギギ

それと
dat2htmlの多段ポップアップすげー!
と思ったです。

152 :名無しさん@勉強中 ★ :07/10/12 00:42:08 ID:???
DIGI BLOG - JavaScriptの@cc_onでIEを区別
http://blog.livedoor.jp/mksaver70/archives/50918083.html
XMLHttpRequestの門を軽く叩いてみる::[7korobi8oki.com]
http://www.7korobi8oki.com/mt/archives/000048.html
雑学 | JavaScript で、1行 IE 判定
http://blog.caperu.secret.jp/?eid=175144
Ajax基礎
http://shoppers-jp.com/tech/ajax_01.html
Hawk's W3 Laboratory : XML : XMLHttpRequestについて
http://web.archive.org/web/20061106191224/http://www.hawk.34sp.com/stdpls/xml/xmlhttprequest.html

153 :名無しさん@勉強中 ★ :07/10/12 08:56:24 ID:???
http://jbbs.livedoor.jp/bbs/read.cgi/computer/2132/1043649025/754

> 暇つぶし2chは、「dat落ち変換機」ではありません。

えーと
私の所が念頭にあるのは
まず間違いないのでしょう

気を悪くしておられるみたいで
ごめんなさいです

154 :名無しさん@勉強中 ★ :07/10/13 08:05:18 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1175735168/928

投稿時にbeチェック付け忘れたですがまあいいや

それはそうと

http://ex20.2ch.net/test/read.cgi/gline/1175735168/425n-

何か御返事したほうがいいのかもなんですが
さて何を書けば良いのやら・・・。


以前、o2onにもアクセス出来たら面白そうだなと思ったのですが
格段に難しいだろうなと。
ソースは提示されておられるみたいですが
まあ見てもわかんないで終わりそうです。

生禿のひろせあさんはo2onと連動されておられるそうなので
どういうものなのか一度教えて頂きたく思ったりしたです

155 :名無しさん@勉強中 ★ :07/10/13 12:24:42 ID:???
JavaScript高速化 - まさにっき(使えないプログラマーの記録)
http://d.hatena.ne.jp/seiunsky/20071010/1192037567#c

なるほど!!!
そういう事か!!!!!

って事は
>>132-133の件も
もしかしたら
そういう事なのか!!!(意味不明)

156 :名無しさん@勉強中 ★ :07/10/13 19:41:59 ID:???
回線を変えたらIPが変わったので
そしたら下記掲示板のレスが増えてるのが判ったです
というか今まではじかれていたんですかね
リロードしても全然変化なかったのは




http://bbs.2ch-library.com/test/read.cgi/main/1142189971/175

> ミラー作成や転載はしないようお願いします。
> リンクは自由にしてもらってかまいません。

これ数日前に気付いたのですが
>>75

http://usamimi.info/~mirrorhenkan/2ch/excel/

の事を指してるのだろうなと。
別にケンカする訳ではないんですが
これくらい許して欲しいです。

お作りになられたexcelスレのミラーは

http://request2.2ch-library.com/bsoft/excel.html

ですが、
これってベタなhtmlなので
全文検索も出来ないですし
何より
html化されてるものや本家で残ってないものは捨象されています。
専用ブラウザで読む事も敵いませんし
スレッドの追加も簡単には出来ない。(と 上記スレ12でお書きになられてます)

自分の所のなら追加や挿入・削除も簡単ですし
(アップロードするかsubject.txtを弄るだけでいいので)

という訳なので

申し訳ありませんが、大目に見て頂きたく思うのです。



って 今気付いたんですけど

だから私
・・・アク禁されたのかな?

157 :名無しさん@勉強中 ★ :07/10/14 18:59:46 ID:???
何か書いたほうが良いのかもなんですが
ほんと何書けばいいのか思いつかないのです
ごめんなさい

158 :名無しさん@勉強中 ★ :07/10/17 18:41:10 ID:???
いやー
yykakikoの今回のダウンは長かったですね。
回線の問題もあるかもですが
半日くらい閲覧出来なかったです。

【掲示板】わいわいKakiko【無料レンタル】
http://pc11.2ch.net/test/read.cgi/esite/1096290166/l50

で、まあしょうがないので
yykakikoがダウンしていた場合に備えて
同じようなものを設置してみたです

場所ですが

http://www.geocities.jp/mirrorhenkan/

から掲示板へのリンクをクリックしてみたらわかるです
たぶんわかると思う
わかるんじゃないかな
まちょっと以下略

159 :名無しさん@勉強中 ★ :07/10/17 18:59:23 ID:???
いやそれにしても
takatyanさんすごいなー。
dat落ち依頼スレッドがdat落ちしそうな勢いじゃないですか。

私も依頼させて頂こうかな。

160 :名無しさん@勉強中 ★ :07/10/18 10:06:28 ID:???
http://6419.net/
が引っ越しされたようで。

sports2サーバ等のまとめをやっておられたですが

0qv.org
http://0qv.org/

に移動して

http://0qv.org/l/

にあるです。


「Last update 2007.10.13」との事で
みんな息が長いなーと。

161 :名無しさん@勉強中 ★ :07/10/18 21:37:02 ID:???
この板のURLは変わってないですが
入口でまた少し遊んでみたので
更に見てる人は減ったかも。
ブックマークや専用ブラウザ登録してる人もそう居ないでしょうし。
って そんな体たらくなのに
他の人の書き込みとか期待しても無意味じゃないかー!

それはそうと
最近凄い人がいっぱい集まって来てる感じなので
お母さんガクブルしてるですよ。
何か書こうにもまずチェックや調べものをしないといけないんですけど
その余裕が無いのです
何も手持ちがないのに書き込むのも何だしなと。

dat2html作者のtatsuさんが出てきて驚いたですが
自分が2chで拝見したのは
JaneNidaスレでtaiwan2chのdat対応をされた時の書き込み以来です。
確かworld2chのdatにも対応されたですから
ロジックを消してなければ 今でも
文字コードUTF-8のdatをhtml化出来るのだろうなーと。

162 :名無しさん@勉強中 ★ :07/10/18 22:01:32 ID:???
メモ
DAT2HTML ver.0.34bpFIXで生成したhtmlのdat化について


正規表現
m#<DT>(?:<A.*?>)?([0-9]+).+?(?:<A HREF="mailto:(.+?)">)?<b>(.*?) ?</B>(?:</A>|</FO
NT>|</a></font>) ?:(.*?)(?:<br>)?<DD>(.*)(<BR><BR><dt>|<br><br></dl>|<br><br></span>)#mik

前処理
s#\nfunction .+?\n#\n#igk

これで出来ると思うです
いちおう今までのDAT2HTML0.26と整合性を持たせたつもり。


・・・したらばだったら
正規表現は一行で書けたのかな?

163 :名無しさん@勉強中 ★ :07/10/19 09:31:25 ID:???
台湾版ニコニコ動画が昨晩から稼働したですが
そのサポートBBSを見ておったまげたです

交流討論串
http://tw.bbs.nicovideo.jp/user/

ここここれははっ!!
私がプチハック(カッケー!)して出してる
文字コードUTF-8
の0chスクリプトではないですかっ!

http://mirror.s151.xrea.com/0ch_utf8/

ニコニコのほうでは最下部のリンクも何もないですが
htmlタグやそこかしこにある英文が私のものと一字一句同じなので
まず間違いないです。

例えば、顕著な所だと 書き込み時のクッキー確認。
単語から何から全く同じ。
翻訳サイト片手に合ってるかどうか不安なまま適当にひねり出した文章なんですが
これ 間違ってないんですかね?
あと スクリプト中で3箇所ほど気になってたところがあるんですけど
偉い方が直して下さっているのでしょうか。

それにしても
read.cgiのほうにもmirrorhenkanのクレジット入れといたら面白かったなー。
バージョンアップ(カッケー!)しようにも
どうやったんだか忘れちゃったですし。
あの頃の私は偉かった。

164 :名無しさん@勉強中 ★ :07/10/19 10:18:31 ID:???
ドワンゴの方がやっておられるですね。
菅野美穂さんのファンなのでしょうか。

[掲示板名]@0ch掲示板
http://tw.bbs.nicovideo.jp/bbs/

で、ここ↓見ると やはり私が訳した文章があるです

交流公告牌
http://tw.bbs.nicovideo.jp/taiwan/

板名がドット(「.」)でもOKだったなんて。

BBS@0ch
http://tw.bbs.nicovideo.jp/./

165 :名無しさん@勉強中 ★ :07/10/19 12:10:49 ID:???
うむ
やはり私の改造したスクリプトだ
バグがそのまま残ってるです

關於付費...
http://tw.bbs.nicovideo.jp/test/read.cgi/user/1192756259/l50

メール欄でのアットマーク(「@」)が
みんな「[at]」になってしまってるです。
作った当初から気付いていたですが
こんな色物スクリプト使う奴おらんやろとそのまんまだったでした


でまあ バグはバグなんですが
メールのやりとりに使う事はほとんどなかった(過去形)ですし
各種クローラーにメールを拾われてスパムが来るような事態も避けられそうなんで
このままでもいいかなと。
直したほうが良いですかね?
って ドワンゴの社員さんならお茶の子さいさいだと思うですけど。


それにしても
2chに関係している会社なのに
何故 本家のスクリプトを流用しないのかなと。
そのうちするでしょうけど。

166 :名無しさん@勉強中 ★ :07/10/19 20:19:45 ID:???
あれれ
404になってますね。
スクリプト自体は残ってますが。


トップに小さな文字で
「非常抱歉,管理的時候,消失記?」(コピペ)
「非常抱歓,管理的時候,消失記録」(タイプ)
ってあるですけど(って化けるかな)
消えてしまったのかな

167 :名無しさん@勉強中 ★ :07/10/19 20:41:09 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1175735168/962-963n

えーと
962は私なのですが
どうしたものでしょうか。
非プレビュー版ので調べただけなのですが。

html化CGI経由でもdat直読み経由でも
どちらもCGIを使うとの事なので
html化のほうをリンクしたですが
よくなかったのかな。
htmlのほうならキャッシュされるとの事ですし。

すみませんが
一晩このままでやってみるです。

168 :名無しさん@勉強中 ★ :07/10/19 20:47:43 ID:???
と書いたけど
上記スレ964の書き込みを見て
何かもう色々めんどくさくなったので
フレームリンクを消したです
これで過剰アクセスも減るでしょう

169 :名無しさん@勉強中 ★ :07/10/19 21:02:17 ID:???
html化CGIのほうをフレームリンクさせたのはもう一つ理由があって
datを開こうとすると
ダウンロード画面になってしまうからというのがあります。

調べてみると、どうもContent-Typeが「text/plain」ではなく
「text/dat2chlog」で返ってくるのが原因みたい。
proxomitronでContent-Typeを「text/plain」にしてみたら
ブラウザで表示出来ましたので。
やっつけで書いたフィルタを書いておくと下記
これでtext/plainで返ってくるです

[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Type: text/dat2chlog set filter (in)"
Match = "text/dat2chlog"
Replace = "text/plain"

ちなみに
http://ex20.2ch.net/test/read.cgi/gline/1165245437/440

http://takatyan.ddo.jp/にあるdatを
専用ブラウザでリダイレクトするフィルタみたいですね。
やってみたらうまくいきましたし。

説明も何もないので皆スルーしているですが
ctrl+shiftでスレッドのリンクをクリックすれば
dat陳列棚の該当datへリダイレクトされるです。

170 :名無しさん@勉強中 ★ :07/10/19 21:12:25 ID:???
うーむ
何か書き込みしにくくなっちゃったなぁ




閑話休題
さて

>>163-166のような事があったので
ふと思い出して
消えていた0ch改造スクリプトをいくつか(といっても3つ)復活させて
リンクしたです。


0chスクリプトread.html化
http://mirror.s151.xrea.com/0ch_html/
0chスクリプト鏡面化
http://mirror.s151.xrea.com/0ch_mirror/


どれもこれも需要やニーズとは無縁で
面白そうだからやっただけなので
断じて
誰かに何か言われるような筋合いのものではありません

171 :名無しさん@勉強中 ★ :07/10/19 22:12:38 ID:???
本家ニコニコ動画のほうの掲示板もあったです
とろいのでなかなかわかんなかった

ニコニコ動画への要望掲示板
http://bbs.nicovideo.jp/request/


この掲示板スクリプトなんですが
img0chをつかっているみたいですね。
試しに存在しないキーで呼び出してみて判ったです

http://bbs.nicovideo.jp/test/read.cgi/question/110261062/l50

172 :名無しさん@勉強中 ★ :07/10/20 13:32:37 ID:???
うーむ
ここ見ておられるみたいですね。
やりたいようにやれば良いんじゃないでしょうか。
私のように。

一晩考えたですが
結果表示からその34のリンクを外したです。
理由は、昨晩のような
「検索した」「ホントにしたの?」
というようなやりとりが頻発するかもしれないと思ったので。
何というか
やる事やってなさそうだと思ったら
スルーすればいいだけの話じゃないですか。


昨晩までの「その34」を付けたバージョンは此方↓なので
そっちを使いたい人はどうぞです

http://www.geocities.jp/mirrorhenkan/index20071019.html


で、禍根を残されても正直困るです。
私もまた依頼するかもですし。

173 :名無しさん@勉強中 ★ :07/10/20 15:51:52 ID:???
台湾版ニコニコ動画交流板のログがなくなっていたので
自分とこのJaneNidaで読み込んでいた分を出しといたです

http://mirror.s151.xrea.com/2ch/0chu/utf8/

書き込んだ方のTDL等を見ると
本当に台湾の方々みたいですね。
(もちろんプロキシ等での偽装は可能でしょうけど)
例えば下のスレッドとか見ると
TDLがtwの方々の「真的感動」みたいな書き込みばかりです

先賀
http://mirror.s151.xrea.com/2ch/0chu/test/read.cgi/utf8/1192692016/l50


でも
何かログが消えた後の現在って
凄く寂しくなってるですが・・・。

http://tw.bbs.nicovideo.jp/user/

何事も
はじめが肝心なんだなーと。
覆水盆に返らずですか。

174 :名無しさん@勉強中 ★ :07/10/20 21:09:35 ID:???
>>169の関連で久しぶりにproxomitronスレを覗いたら
凄い方がmixiの軽量化フィルタを出されていたので
あれこれ試行錯誤しながら入れてみたら
とても軽くなったです。



そう
ここは私の日記帳(という訳でも)

175 :名無しさん@勉強中 ★ :07/10/21 07:55:37 ID:???
メモ

test
http://tw.bbs.nicovideo.jp/test/read.cgi/user/1192791311/

上の12-14などはTLDが「net」になってるです。
たぶんhttp://hinet.net/のプロバイダの方だと思うので
スクリプト中の(ってどのモジュールだったか覚えてないですけど)


my($country) = "";
my(@domain2) = ();
@domain2 = split(/\./,$domain);
if ($domain2[-2] eq "softbank" || $domain2[-1] eq "jp"){
$country = "jp";
}else{
$country = $domain2[-1];
}



my($country) = "";
my(@domain2) = ();
@domain2 = split(/\./,$domain);
if ($domain2[-2] eq "softbank" || $domain2[-1] eq "jp"){
$country = "jp";
}else if ($domain2[-2] eq "hinet" || $domain2[-1] eq "tw"){
$country = "tw";
}else{
$country = $domain2[-1];
}

試してないので何ですが
上のようにやれば
プロバイダがhinet.netの方も
TLDに「tw」が入るのではないかと思うです

176 :名無しさん@勉強中 ★ :07/10/21 08:14:07 ID:???
>>175訂正


}else if ($domain2[-2] eq "hinet" || $domain2[-1] eq "tw"){


}elsif ($domain2[-2] eq "hinet" || $domain2[-1] eq "tw"){



>>173なのですが
香港のgeocitiesアカウントにアップしてread.htmlを使おうと思ったのですが
やってみると
拡張子datはアップロードを禁止されとったです
韓国のgeocitiesも同様。

何でなんでしょう。
日本のはOKなんだけどなー。

177 :名無しさん@勉強中 ★ :07/10/21 10:22:53 ID:???
>>6の件

外部コマンドスレの
http://jane.s28.xrea.com/test/read.cgi/bbs/1180559017/587-600
で色々出てるですが
あんまり外部ツールを入れたくないので
ReplaceStr.txtで何とか誤魔化したです

<rx>(h?t?tp://.+?\.youtube\.com\/watch\?v\=)(.{11})[TAB]$1$2<br><font size="-2">【FLV: http://cache.googlevideo.com/get_video?video_id=$2】</font><br>[TAB]msg


・・・が、試してみると
どうもうまくいかない。
やり方が悪いのか仕様変更したのか。(両方かも)

178 :名無しさん@勉強中 ★ :07/10/21 10:33:05 ID:???
と書いてからもっぺん試してみたら
出来てましたです。



ついでに
ImageViewURLReplace.datを弄って
台湾版ニコニコ動画の画像表示も出来ないかとやってみたですが
どうやら同じ動画でも
日本と台湾ではURLが違うみたいですね。
どうも駄目っぽい。

http://www.nicovideo.jp/watch/sm1323730
http://tw.nicovideo.jp/watch/1192911041

179 :名無しさん@勉強中 ★ :07/10/21 12:26:56 ID:???
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/493-494

あー恥ずかしい・・・。

でも何でこれでエラーが出るのかな
謎です

180 :名無しさん@勉強中 ★ :07/10/22 19:06:29 ID:???
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/493-496

またひとつ賢くなりましたです
それはそうと
htmltodat-convert.wsfをまた直さねばならぬのかとか一瞬思ったですが
考えてみたら 出してある奴って
そういうのを入れてなかったからまあいいやと。
自分用のゴチャゴチャしたものを出して
笑われるのも何ですし。

181 :名無しさん@勉強中 ★ :07/10/23 00:11:50 ID:???
http://takatyan.ddo.jp/test/read.cgi/main/1192376543/4

おー。
いつか忘れた頃にリンクさせて頂くかも。



それはそうと
もしかしたら
下のサイトの管理人さんでもあるのでしょうか。
何か文章の雰囲気が似ているような感じなんですが。

2ch エルフェンリート関連スレ監視所・ログ保管庫
http://elfenlied.takatyan.info/kakolog/



「エルフェンリート」ですか
新しい世界です

182 :名無しさん@勉強中 ★ :07/10/23 00:24:19 ID:???
同じ方のようですね。
エルフェンリート関係以外でも
野球ch板・自己紹介板でもお見かけしたです

私の知らない世界ばかりだなー。

183 :名無しさん@勉強中 ★ :07/10/23 20:33:53 ID:???
さて
ドメイン逆引き出来ないIPの場合、TLDが出ないのですが(jpとかtwとか)
これを何とか出来ないかなと。
Faceちゃんねるの方々などはほとんどドメイン逆引き出来ないみたいですし。

で、下記を援用できるかもしれないなと。

usamimi.info : 中国、韓国IPのDNS接続規制の適応
http://www.usamimi.info/~sakura/cgi-bin/blog/article.php?id=120
ipfwとBINDによるNaverRobot対策フィルタ
http://www.italk.ne.jp/minagawa/tech/krfilter.html

逆引き出来ないIPの場合、上で出されているIPリストを参照して
リストの条件に合致する場合
それぞれの国のTLDを表示するようにする とか
結構うまくいきそうな気がします。

問題は、試す環境が整いにくい という事ですが。

184 :名無しさん@勉強中 ★ :07/10/25 07:16:37 ID:???
メモ

http://yy14.kakiko.com/test/read.cgi/mirror/1172060306/374

この「もひとつスクリプト作るだなー」のものについて。

−−−−−−−−−−−−−−−−−−−−−−
・スクリプト実行
・対象ファイル存在可否
・検索ワードファイル存在可否
・inputboxで検索ワード指定
・結果リストファイル新規作成

ループ開始(条件:対象ファイル最終行まで)
 一行づつ読む
 正規表現で検索ワードでのヒット可否
 ヒットした場合
   結果リストファイルに追記
ループ終了
−−−−−−−−−−−−−−−−−−−−−−
・終了表示


結構簡単に出来そうです

185 :名無しさん@勉強中 ★ :07/10/25 21:08:07 ID:???
メモ

tv2ch.net【試験運用中】
http://tv2ch.net/

よくわかんないですけど
使えたら嬉しいです。

それと、自分とこ
最近やたらにアクセスが激しいので

be to 無料ホームページサービス【独自ドメイン持込対応・最大容量100MB】
http://be-to.com/

とかすっごい興味あるです。
プロバイダメールアドレスが必要との事なので熟考が必要ですが。
それ
とcronジョブは使えるのでしょうか(ってここに書いてどうする)

186 :名無しさん@勉強中 ★ :07/10/27 08:20:43 ID:???
syoboon - 記載漏れが有ったのでお詫び
http://syoboon.asks.jp/71856.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
# メモ
# ereg_replace('.dat', '', $str);
# ↓
# substr($str, 0, -4);

----

From: 22世紀
2007-10-25 06:18 pm (UTC)
substrとstr_replaceだとどっちが早いんでしょう。

From: syoboon
2007-10-26 05:41 am (UTC)

同じ結果になるものを10万回ループで計ってみたところ
substrが0.0672秒、str_replaceが0.2206秒
ereg_replaceは3.0330秒という感じでした。

eregは恐ろしく遅いですね・・・。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−


へー
勉強になるです。

そういえばsyoboonさんも黙認して下さったようで良かったですよ
http://syoboon.asks.jp/65446.html

187 :名無しさん@勉強中 ★ :07/10/27 09:06:39 ID:???
http://jane.s28.xrea.com/test/read.cgi/bbs/1180559017/631-633

htmltodat-convert.wsfに渡せば一発じゃんとか思ったですが
どうでもいいや

188 :名無しさん@勉強中 ★ :07/10/27 17:31:13 ID:???
メモ

nakanohito
http://rikasaku.vlegends.net/

石川梨華と美勇伝のログと画像を保管公開されておられるみたい。

狼板のログを丸ごと収集している所ってないのかな。
ここってvipみたいに流れが凄い速いので取りこぼしが多いのですが。

189 :名無しさん@勉強中 ★ :07/10/27 19:04:36 ID:???
>>184ですが
えらい簡単に出来たです。
とりあえず狼板の611万スレで7メガくらいのsubject.txtをターゲットにして
検索語をいろいろ変えて遊んでますが
結構使い物になる感じ。
いやーコンピュータの処理能力って大したもんだ
少年よ大したもんだ。

まあこんな程度の汎用的なスクリプトは
とっくに誰かが作っているでしょうけど
いい頭の体操になりましたです。

190 :名無しさん@勉強中 ★ :07/10/28 15:04:32 ID:???
覚え書き

ニコニコ動画のFLVファイルですが
proxomitronでのクッキー送信で何とかなったら嬉しいですが
どんなもんなんでしょ

って
訳わかんない文章ですねそうですね

191 :名無しさん@勉強中 ★ :07/10/28 17:28:10 ID:???
111ch @ 7bit
http://nanabit.net/softwares/111ch.html
【スレッド】2ch型掲示板【フロート型】 ログ倉庫
http://limit.s14.xrea.com/

192 :名無しさん@勉強中 ★ :07/10/28 17:42:14 ID:???
>>189ですが
>>186の如く
検索条件と比較する処理を正規表現でやってると
かなり速度に違いが出るのかもです。
とはいえ
決め打ちした単語しか抽出出来ないものよりは
正規表現が使えるほうがいいですが
さてどうしたものか。

193 :名無しさん@勉強中 ★ :07/10/29 20:03:12 ID:???
上で作ったスクリプトで調べてみたです


行方不明スレッド捜索します。 その6
http://ex20.2ch.net/test/read.cgi/gline/1170072993/243
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
243 名前:水先案名無い人[] 投稿日:2007/10/29(月) 18:21:10 ID:Zy4OrJIKO
2005年秋
カップル板
女は乳を吸われているときに何を考えてる?part3
もしも母乳が出たら彼氏に飲ませてあげますか?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

あっという間に見つかったです
3分もかからなかった



もしも母乳が出たら彼氏に飲ませてあげますか?
http://love3.2ch.net/test/read.cgi/ex/1132227612


love3/love4いずれのサーバでもヒットしませんでした
そのスレは立っていないのではないかと



とはいえ
開発(カッケー!)したスクリプトをリリース(カッケー!)するには
説明のhtmlを何か書かなければいけなさそうですが
そういうのやる気力が今残ってないのです

194 :名無しさん@勉強中 ★ :07/10/30 02:02:42 ID:???
上下逆でしたね


さて
何でかよくわかんないですが
ついさっき見てみたら
ハングル版のページに現地の方々が大挙しているみたいです

広告タグが悪さしてスクリプトエラーになってるですが
最低限 動くようにはしたいところですな。

気が向いたら
直しておきますかね。

195 :名無しさん@勉強中 :07/10/31 20:37:18 ID:4TMBovqU
いろいろ付けようかなと思ったですが
余裕がなくて
いつ出来るだかわかんないので出しとくです

テキスト内 単語検索抽出スクリプト by WSH
http://www.geocities.jp/mirrorhenkan/others/textsearch/

最低限のスクリプト
本文30行
エラー処理も何もなし

余裕が出来たら色々追加しますか。
でも時間が経つと
またスクリプトの書き方から何から忘れちゃうしなあ

196 :名無しさん@勉強中 :07/11/01 04:01:42 ID:sOZ4Orz2
>>195ですが
検索ワードに正規表現を使えるものも追加したです。
めんどうなので別スクリプトという事で。

で、この正規表現版って
>>186の如く
非常に遅くなりますね。

6.6メガで11万スレのsubject.txtをターゲットに
同じ検索ワードで実行してみたですが
終了するまでの時間結果が下記

−−−−−−−−−−
通常版:18秒
正規表現版:3分21秒
−−−−−−−−−−

いやー
こんなに違うとは思わなかったです

197 :名無しさん@勉強中 :07/11/01 04:32:36 ID:sOZ4Orz2
ついでに少し考えてみましたが(考えただけです)
通常datをかちゅdatに変換するスクリプトも
簡単にwshに移植出来そうですね。

datの改行コードもCRで出力可能ですし
ボードデータをスクリプトと同フォルダに置けば
idxファイル生成も出来るでしょう。

何よりも
wshに移植した場合、最大のメリットは
フォルダ内全datの一括変換も可能になるだろうという事ですか。
ただ レスアンカーでのポップアップの関係上
同板・同サーバにあるdatに限られると思いますが。>一括変換



ただし
このスクリプト作成検証の為だけに
かちゅ〜しゃを入れる気には全くならないです。
作者さんやkageさんには申し訳ありませんが。
今までかちゅ〜しゃを入れずにやってきたので
今回も入れたくないなと。

てか 自分の中では
かちゅ関係の事にはもう関わりたくないですよ
んもう つくづくイヤになっちゃった


以上
思考実験 終わり

198 :名無しさん@勉強中 ★ :07/11/03 14:22:00 ID:???
monazilla Part 5
http://pc11.2ch.net/test/read.cgi/tech/1057329161/777-787

wshでなら簡単に出来ますな
てか作って公開したら面白そう
毒喰らわば皿まで

でも実際に作成公開しても
何も起こらないような気がするです。
一つの板のクローラーどころか
複数板クローラーも作って出してるですが
今のところ何もないですし。

てか 話の流れを見てると
monazillaスレには
まずbe付きでは書き込めませんな

199 :名無しさん@勉強中 :07/11/03 14:28:23 ID:zXk0Vn9g


何だ何だ
今出してある奴を組み合わせれば
現状でも出来るではないですか。

200 :名無しさん@勉強中 ★ :07/11/03 14:45:42 ID:???
>>198追記

> 複数板クローラーも作って出してるですが
と書いたですが
これって私ではなく
前スレ381さんと421さんがお書きになられたものを
忠実に付け加えたものです

「作って」という自分の言葉に違和感を覚えたので付記
どのあたりからオリジナルとか別物だとか
そういうの どうでもいいです
動けば何でもいいじゃないかと

201 :名無しさん@勉強中 ★ :07/11/03 17:50:12 ID:???
さて
試験的に
http://wwwww.2ch.net/news4vip/kako/
のsujbect.txtをスクリプトで連結取得したら
77メガ1457114行の巨大ファイルになりました。

で、その巨大ファイルを
>>196で出したものを更に少しいじったスクリプトで
ブーンスレを検索抽出してみたです

71415件ヒットしました。
七万千五百スレあるですか。
勿体ないから出しとくです

http://mirror.sarashi.com/boon.txt

740kbのテキストファイルですが
ブラウザ表示はすんげー遅いなー。
14287行あるからかな。



「だから何」と言われても
何でもないです

202 :名無しさん@勉強中 ★ :07/11/04 10:19:10 ID:???
わずか565バイトテトリスのプログラミング解説
http://zapanet.info/blog/item/1125

あとで読んでみよう

203 :名無しさん@勉強中 ★ :07/11/04 17:49:19 ID:???
http://pc11.2ch.net/test/read.cgi/win/1190548945/49-50

・・・しまった。

beクッキー消さずに書いてしまったぞ。。

私のバカバカ

204 :名無しさん@勉強中 ★ :07/11/04 19:22:46 ID:???
さて
あまりにもアクセスが多くてガクブルなので
ミラーを作りました
もし宜しければそちらのほうも使っていただければと

http://www.geocities.jp/mirrorhenkan1/
http://www.geocities.jp/mirrorhenkan1/index1.html

作った事に反省はしていない
殺伐とした世の中
童心を忘れたら
人生闇ではないですか


まあmirrorhenkanのほうも
容量50メガ中 46メガくらい使ってるので
そこが一杯になったらmirrorhenkan1のスペースを使うかなと。

205 :名無しさん@勉強中 ★ :07/11/04 19:37:19 ID:???
ちなみにタグを弄る時に思うんですが
ほんとIEって独自仕様が多いですね。
http://udon.be/の管理人さんほど極めている訳ではないですが
つくづく思うです。

>>204もIEとそれ以外では表示が全然(ほんとに全然)違いますし。

で、違うだけならいいんですが
IE7ではこれまた中途半端にMozillaに擦り寄った仕様になったみたいで
スクリプトを作る人泣かせですね。

具体的に書くと
IE7ではxmlhttpの仕様がまたまた変わったので今までのものがうまく行かず
wannabe専用変換機やread.hmlを作る時にかなり悩んだです。

とか書いたですが
まあ別にどうでもいいや
うむ

206 :名無しさん@勉強中 ★ :07/11/05 09:05:23 ID:???
mirrorhenkan : 結果 61 - 70 : LemmeFind.jp
http://www.lemmefind.jp/search.php?p=7&t=mirrorhenkan

207 :名無しさん@勉強中 ★ :07/11/07 23:34:13 ID:???
さて
時代がやっと私に追いついてきたみたいなので
説明文を少しだけ追加してみたりして

0ch for world2ch
http://mirror.s151.xrea.com/0ch_utf8/

JaneNidaもかなり前からUTF8対応して頂いていたのに
今まで書いてなくてごめんなさいです。
にしても 需要とは無縁の機能で
私以外使っている人居るのかな。
まあゼロではないと思いますが。

あと
多くの携帯機種がUTF-8対応していたのには驚きました。
これも併せて追記したです

208 :名無しさん@勉強中 ★ :07/11/08 10:54:28 ID:???
何か検索してたらヒットしたんですけど

http://piece.s201.xrea.com/p/yomi.cgi?mylinkact=add&mylinkid=3151
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
0ch BBS (ぜろちゃんねる)絵文字対応版 | [3151:DEL] [掲示板:2ちゃんねる風]
携帯絵文字の挿入・表示に対応した改造掲示板
携帯用の絵文字を『ぜろちゃんねる』で表示できるように改造した掲示板。PC用画面
からも絵文字入力が可能。各携帯電話ごとの振り分けに対応。設定ファイルのインポ
ート機能搭載。禁止語句である投稿を拒否するか、任意の文字に置き換えるか選択
可能。TOPページに掲載する告知欄に広告や文字を挿入可能。管理者権限、削除人
権限を与えるキャップ機能搭載。

0ch BBS Scriptの『0ch BBS』改造版
   配布先: MagCup + ◆hikArinCL2 http://www.45ch.tv/
   [ SAMPLE ] http://mirror.s151.xrea.com/emoji/emoji/ 
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−



・・・。



いろいろと
間違ってないですか?

とりあえず、配布先は
http://mirror.s151.xrea.com/emoji/
のほうにして頂きたいなと思ったですが。

209 :名無しさん@勉強中 ★ :07/11/09 22:04:40 ID:???
さて
鏡の国スクリプトも
UTF-8対応させたり
絵文字対応させたり
してみたら面白いかなと思うですが
検索してみたら
既にやってる方が居られるですね。
でもソースを出されないままフェードアウトされたみたい。
大学に入って新規事業立ち上げで忙しいとかで

PHP 2chBBS 『改造情報』
http://script.s16.xrea.com/2ch/test/read.php/php/1048578946/

14で中国語やタイ語という話も出てますし
二つとも作ってみたら結構面白いかもですね。
ソースもperlよりはphpのほうがとっつき易いですし。

とりあえず、諸外国のウェブスペースはphpが主流なので
UTF-8化して管理画面も英語化すれで
ほんと かなり面白いかもしれない。

先に書いておきますが
「面白そうだな」というだけの事であって
外国文化に負けまいとしているのではなく、
世に意図的にインパクトを与えようとしているのでもないです
「同じものを志す者」がそうそう居ないのが寂しいですが。
居ても スキルが段違いで へし折られるのがオチですし。

210 :名無しさん@勉強中 ★ :07/11/09 22:17:43 ID:???
あとUTF-8版0chスクリプトのほうも
管理画面を英訳したいところですが

管理画面の使い方とか
あんまりわかんないんだよなあ
いつも適当にやってるだけなもんで

211 :名無しさん@勉強中 ★ :07/11/09 22:32:59 ID:???
あちらに書くとグダグダになりそうなので


お前ら、wsh使ってますか? Part7
http://pc11.2ch.net/test/read.cgi/win/1190548945/67
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
67 名前:名無し~3.EXE[sage] 投稿日:2007/11/09(金) 14:14:28 ID:kUQK3taz
>>50
> Set FS=CreateObject("Scripting.FileSyst" & "emObject") ;

>>49じゃないけど、これはNG。

まあこの程度ですり抜けられるようじゃアンチウイルスの意味無いと思うし。


ただし、UWSCスクリプト内でFileSystemObject呼んだ場合は何にも言われないから
同様のパターンで実行可能なのがあるかもしれない。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


別にどうでもいいんですが
2点疑問が。

(1) 「これはNG」の意味ですが
「これに書き換えても、マカフィー(ノートン)で誤検出メッセージが出る」のか
「(同上)メッセージは出なくなるが、その場しのぎのやっつけだからダメ」なのか。

(2) 67さんは この誤検出に対してどういう対処方法があると思うのか。



自分も
http://www.geocities.jp/mirrorhenkan/others/norton/
の誤検出を何とかしたいんですが。


前スレ677さん見てますか?
見てたら この件 見て頂きたいんですが。

212 :名無しさん@勉強中 ★ :07/11/10 07:44:19 ID:???
>>211自己レス

よく読んでみると
> UWSCスクリプト内でFileSystemObject呼んだ場合は何にも言われないから
とあるので
(1)は「やはりメッセージが出る」という事なのでしょう。

「UWSCスクリプト」って何だかわかんないので
ググってみたら

UWSC
http://www.uwsc.info/
UWSCスクリプトの解説[素人プログラマーBig]
http://big.tm.land.to/handbook/uwsc.htm

ああ、そういうツールみたいなものなのかと。
DMonkeyみたいなものかと。
何か入れるのは気が進まないなー。

213 :名無しさん@勉強中 ★ :07/11/10 13:44:34 ID:???
メモ
下記URLdat化

http://script.s16.xrea.com/2ch/php/kako/1031969535.html


m#<DT.*?>(?:<A.*?>)?([0-9]+).+?(?:<A HREF="mailto:(.+?)">)?<b>(.*?)</B>(?:</A>|</FONT>) ?.*?:(.*?)(?:<br>)?<DD>(.*)<BR><BR>#mik

何故か変換結果プレビューで
スレタイが出ないですが。

214 :名無しさん@勉強中 ★ :07/11/10 13:59:47 ID:???
ああ、プレビューが前と違って見えるのは
JaneNidaと同フォルダにhtmltodatを入れていて
スキンを入れたからなのかもしれないです。
ここら辺 よくわかんないや

>>213修正

URL再掲
http://script.s16.xrea.com/2ch/php/kako/1031969535.html

正規表現
m#<DT.*?>(?:<A.*?>)?([0-9]+).+?(?:<A HREF="mailto:(.+?)">)?<b> ?(.*?)</B>(?:</A>|</FONT>) ?.*?: ?(.*?)(?:<br>)?<DD> *(.*)<BR><BR>#mik

後処理
s#(\n.+?)(◆.+?) *?(<>)#$1</b>$2<b>$3#igk


後処理は、1にトリップ付きの方が居たら変換出来ないですが
んもうわかってますってハイ
65に「taketyan◆/FxUJPB2」さんが居られますが
読めないdat陳列棚のtaketyanさんとは別の方でしょうか。

215 :名無しさん@勉強中 ★ :07/11/10 14:44:10 ID:???
Header.htmlに

<font color="red"><b><TITLE/></b></font>

を追加したら
htmltodatの変換プレビューにもタイトルが出るようになったです。
あー良かった

216 :名無しさん@勉強中 ★ :07/11/10 19:45:50 ID:???
taketyanさんじゃなくて
takatyanさんでしたね

さて
0chスクリプト絵文字表示板を見てたですが

ぜーんぜん わっかんねーでやんの。

おいおいお前
どっからこのスクリプトパクってきたんだよ と。
フフフフフハハハハハハハハハハ
わははははははははっ

あんまりこういう事ばっか書くと
「ホント どこからパクってきたの?」
って 本気で訊いてくる人が出てくるかもしれないなぁ。
自重したほうがいいかも。


でも、どうやったんだかトレースして思い出すよりは
別の事やったほうがずっと建設的かもですね。
現状でも まあまあイイ線いってるみたいなので。

217 :名無しさん@勉強中 ★ :07/11/11 10:36:23 ID:???
メモ
台湾のふたばちゃんねる
巫女とかメイドとかのみならず
YURIとかYAOIまであるです
台湾すげー


=2cat=站
http://2-cat.twbbs.org/~2cat/
Komica
http://www.komica.org/
Komica2
http://komica2.dreamhosters.com/


スクリプトも、台湾語訳したものを
Joyful Note と ふたばスクリプトの両方とも
DL出来るようにして下さってるみたい
これがあるとないとでは
伝播力が偉い違うですよ

Pixmicat! in Development
http://pixmicat.openfoundry.org/
Joyful Note 改造基地
http://clspaste01.hp.infoseek.co.jp/joyful/


それとは別に
Taiwan 2chは改装中との事なのですが
いつ復活されるのかなと。
JaneNidaで読めるようにして頂けたら嬉しいのですが。

維修中
http://www.comic.com.tw/mini02/

218 :名無しさん@勉強中 ★ :07/11/11 11:00:20 ID:???
てか検索したら
2chタイプ・ふたばタイプの掲示板って
諸外国にすっげーあるではないですか。
英語やロシア語や台湾語のは知ってたですが
ドイツ語やスペイン語やフィンランド語やスウェーデン語やポーランド語やその他諸々
英語だってすごくたくさんあるですし
国でいったらエストニアやリトアニアとかまで
って ほんまかいな

The Overchan - A directory of English 2ch-boards
http://www.1chan.net/overchan/




メモ

しおからphpスクリプト
http://siokara.que.jp/

219 :名無しさん@勉強中 ★ :07/11/11 11:50:11 ID:???
フランスもハンガリーもアルゼンチンもあるですなー。

スクリプト下部の作者リンクから辿ったら
香港の方も居られるですね。

某廢柴的廢棄日記
http://scrappedblog.blogspot.com/

220 :名無しさん@勉強中 ★ :07/11/11 12:38:26 ID:???
あちこち見てて思うのは
例えば下記

【世界】外国語版2chプロジェクト 第2弾【進出】
http://etc6.2ch.net/test/read.cgi/event/1060795578/169
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
169 名前:参加するカモさん[sage] 投稿日:03/12/27 11:43 ID:EnEabWcb
mangaはcomicのうちだからひとまとめに"comic"板にしてもいいような。
なまじ、普通に「漫画」という固有の国の言葉が板に入ってると、
グローバルにしては明らかに日本中心的でチョット変かも。
同じ理由で"anime"もどうかな。「アニメ」は日本特有な感じがする。
(というか人が少ないから、comicもmangaもanimeも最初は一つの板で
十分だったのではという気も。内容も似てるし。)
板を作る時には名前の意味等をよく考えた方がいいと思う。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

ほんの4年前の書き込みですが(まだ現役スレなのがすごい)

> なまじ、普通に「漫画」という固有の国の言葉が板に入ってると、
> グローバルにしては明らかに日本中心的でチョット変かも。

ってあるんですが

どの言語の板でも
「anime」や「manga」のカテゴリが至極普通にあるんですが。
現実っていったいどうなってるんだろうと思ったりするです。
yaoiやBLとかも何の注釈もなくありますし。

221 :名無しさん@勉強中 ★ :07/11/11 16:40:07 ID:???
ふたばスクリプトの中文化ファイルは此方とかかな
学校のスペースなので卒業されたら消えちゃうかもですが

futaba@Taiwan
http://s94.tku.edu.tw/~494180127/futaba/



あと韓国のサイトとか

Moeboard.net by LoliMaster ???????? ?? ?? ?????.
http://moeboard.net/




しかし電脳網とは言ったもので
リンクからリンクへと飛んでいって
キリがないですね。


TOPが違います。
http://eclair.alica.idv.tw/

222 :名無しさん@勉強中 ★ :07/11/11 17:02:10 ID:???
色々なサイトのトップに
「歓迎自由連結」
とあるんですが
これって
「リンクフリー」
って事なのかな。

223 :名無しさん@勉強中 ★ :07/11/11 19:21:16 ID:???
>>221が大元かどうかはわかんないですけど
UTF-8化と中文化したfstyleスクリプトを使った掲示板が少なからずあって
結構面白そうなので
JaneNidaスレに要望を書かせて頂いたです

http://pc11.2ch.net/test/read.cgi/software/1188352731/850

スルーされたら少し悲しくなるかもですが
そしたらproxomitronで何か考えてみますか。
今の所 完全に白紙状態ですが。

224 :名無しさん@勉強中 ★ :07/11/12 09:18:20 ID:???
どうもカンマ区切りのsubject.txtだと
うまく読み込めないみたいですね。
datファイル(datじゃないけど)だとカンマ区切りでも問題ないですけど。




http://jane.s28.xrea.com/test/read.cgi/bbs/1180559017/671-678

やめて欲しいかなとか思ったりしたですけど
自分がやってる事とか思うと
何も言えなくなる訳で。

まあ自分の場合
要望とかそういうの ほとんどなくて静かなもので
そういう意味では実に気楽なもんです
逆に あれもやってくれこれもやってくれと
要望責め(それ何てプレイ?)されたら
何も出来なくなるだろうなと

225 :名無しさん@勉強中 ★ :07/11/12 12:14:47 ID:???
おお
datフォルダを不可視にされてしまったみたい

スレッド
http://2cha.omoe.net/adminroom/read.php?key=1143006319&ls=50
ログ
http://2cha.omoe.net/adminroom/dat/1143006319txt
subject.txt
http://2cha.omoe.net/adminroom/subject.txt

ログのファイルにアクセスしようとすると
404ページに飛ばされるです
しかし何という404なのだ

http://2cha.omoe.net/404.html

226 :名無しさん@勉強中 ★ :07/11/12 13:34:26 ID:???
豆知識
http://komica40.dreamhosters.com/f5/index.php


私はですね
例えばこれをJaneNidaで読んでみたいんですよ。
他にもこういうものがわんさかあるので。

227 :名無しさん@勉強中 ★ :07/11/13 09:36:29 ID:???
>>225はURL間違いだったですね。

誤 http://2cha.omoe.net/adminroom/dat/1143006319txt

正 http://2cha.omoe.net/adminroom/dat/1143006319.txt


それにしても
>>223の後
意味のある書き込みが丸一日無いというのは。
これがスレッドストッパーというやつですか。

228 :名無しさん@勉強中 ★ :07/11/13 19:20:56 ID:???
いやー
漢字って
いい感じ

關於日文實用句子
http://komica40.dreamhosters.com/f5/read.php?key=1192455107
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1 名無しさん [ 2007/10/15(Mon) 21:31 ID:52g5MQeQ ]
因為過幾天,有機會和日本來訪的學生交流
不過苦於日文能力不足,談話時總覺得會出現??的?況
煩請各位島民貼幾句實用的句子,感謝<O>

【訳】
何日か後、日本から来る学生と交流する機会があるんだが、
日本語能力が今ひとつなんで、会話の時に困った状況になりそうだ。
そういうわけでお前ら、実用的な日本文を貼ってくれないか。

2 名無しさん [ 2007/10/15(Mon) 21:57 ID:mbuH5xOg ]
やらないか?

3 名無しさん [ 2007/10/16(Tue) 08:52 ID:.7WC1ftU ]
アニキはしんだ!

4 名無しさん [ 2007/10/16(Tue) 19:22 ID:k1t6bpW6 ]
もう〜おにいちゃんのエッチ☆

5 名無しさん [ 2007/10/16(Tue) 21:27 ID:h1G1Cu0Q ]
フ☆タ☆エ☆ノ☆キ☆ワ☆ミ☆ア
は☆な☆せ

6 名無しさん [ 2007/10/16(Tue) 22:38 ID:2SenOjso ]
買本旅遊用的會話書比較實在。

【訳】
適当な旅行会話の本を買って例文を読めば。

7 名無しさん [ 2007/10/16(Tue) 22:43 ID:30njL3Fc ]
ウホッ!!いい学生!!
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


これとか定番コピペになりそうですね。
訳は適当ですが、当たらずとも遠からずではないかと。

229 :名無しさん@勉強中 ★ :07/11/13 19:45:23 ID:???
>>228ですが
1の訳は
http://news21.2ch.net/test/read.cgi/news4plus/1194220062/461
をそのまま使わせてもらったです

230 :名無しさん@勉強中 ★ :07/11/13 19:58:28 ID:???
メモ
proxomitronの正規表現はこれまた独特ですね。
って 下のでは使ってないですけど


[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Type: 2ch: Subject.txt text/plain -> text/css (in)"
URL = "*/Subject.txt(^?)$KEYCHK(^S)"
Replace = "text/css; fake"

[Patterns]
Name = "subject.txt - connma to <>"
Active = TRUE
URL = "*/subject.txt(^?)$KEYCHK(^S)"
Limit = 256
Match = ","
Replace = "<>"

231 :名無しさん@勉強中 ★ :07/11/14 17:54:16 ID:???
フリーソフト作者の愚痴 31
http://pc11.2ch.net/test/read.cgi/prog/1186296406/201
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
201 名前:仕様書無しさん[sage] 投稿日:2007/09/11(火) 00:35:28
言語ファイルの募集始めた。
いまんとこ数カ国語だけどどこまで集まるか楽しみ。
個人的にはタイ語とかの文字で自分のアプリが動くのが見たい。
地球のみんなオラに力を分けてくれ
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

これ、私の所でも出来そうですね。
文字コードUTF-8の仕様ファイルを用意して
XMLHttpで呼び出して
ボタン名や各種説明文を仕様ファイルの各変数から呼び出し置換するようにして。
結果表示はそれぞれの言語のWeb翻訳プロキシ(?)を経由したURLにする とか。


同様にして
設定仕様ファイルから変数呼び出しするようにすれば
例えば0chスクリプトの各国語版とかも
凄く簡単に出来そうではないですか。

タイ語フォントとか 自分のPCには入ってないですが
それなりに面白そうです。

232 :名無しさん@勉強中 ★ :07/11/14 19:04:23 ID:???
http://pc11.2ch.net/test/read.cgi/software/1188352731/887

恥ずかしい書き込みをしてしまったかなと
叩かれてもしょうがない



メモ
外部コマンド

中日翻訳(繁体)=$CHOTTO http://www.excite.co.jp/world/chinese/?before=$TEXTIU&wb_lp=CHJA&big5=yes&start=%E7%BF%BB+%E8%A8%B3&after=

233 :名無しさん@勉強中 ★ :07/11/14 19:13:34 ID:???
>>230
シフトキーを押しながらメニューをリロードすると
subject.txt中のカンマ「,」を「<>」に変換するproxomitronフィルタでした。

で、もう一つ
シフトキーを押しながら.datをリクエストすると
「******.txt」にリダイレクトするフィルタ

[HTTP headers]
In = FALSE
Out = FALSE
Key = "URL: sstyle BBS dat to txt (Out)"
URL = "$KEYCHK(^S)"
Match = "http://(*)\0(/dat/|/kako/[^/]+/[^/]/)\1(*)\2.dat"
Replace = "$RDIR(http://\0/dat/\2.txt)$FILTER(false)"


これは上手くいったんですが
今までのJaneNidaではUTF-8のログファイルは「<>」区切りでないと
認識してなかったっぽかったので
datファイル中のデリミタを書き換えるフィルタをあれこれ考えてたんですが
JaneNidaのバージョンアップが凄く速くて感動したのです

234 :名無しさん@勉強中 ★ :07/11/15 18:43:54 ID:???
さて
人間の慾とはとめどのないもので
ふたばスクリプトの板をJaneで読んでみたいなと思いました。

ふたばスクリプトの場合
>>218およびその連絡板にあるように
紛う事なく 全世界にそれぞれの言語で存在しているです。
ただ、ほとんどUTF-8で同じ形式のログファイルを使っているので
中・英・独・露・仏・西・葡・蘭・スウェーデン・ハンガリー・フィンランドect各言語の板を
もし専用ブラウザで読み込めた場合、外部コマンドで翻訳出来たりして
とても面白そうではないですか。
ドイツやフランスやロシアの人が現地語で
例えば「萌え〜☆」と書いているのを見てみたい。

極端な話 投稿画像とか読み込めなくてもいいです。
検索してみると、ふたばch専用ブラウザというのも幾つかありますが
どれも画像収集に特化されていて 選択部分の翻訳とかそういうのまであるのは無いのです。
もしあったら教えて下さい。

専用ブラウザを作るスキルが私にあったらなあ。

スルーされる確率のほうが高いと思いますが
少し考えをまとめてから 要望を出してみますか。

235 :名無しさん@勉強中 ★ :07/11/16 11:24:57 ID:???
ここに書く意味もまったく全然ないんですが

http://j2k.naver.com/j2k_frame.php/korean/www.geocities.jp/mirrorhenkan/

これ↑から入力変換しようとしても
スクリプトエラーで全然使えないですですってば。
かといって現在のハングル版とかもエラーですし。

日本語の掲示板を検索するんだから
日本語をマスターしましょうよとか思ったりしたですけど
やっぱみんなラクしたいもんなー。うん。(自問自答)

各国のサイトスペースって一見そっくりですが
広告タグとか容量上限とかファイルサイズとか
全然違うですね。
だがそこがいい。(よくないし意味不明ですよ)

236 :名無しさん@勉強中 ★ :07/11/16 21:02:47 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1165245437/474-475
http://ex20.2ch.net/test/read.cgi/gline/1193462528/63-64
−−−−−−−−−−−−−−−−−
http://occultycurrymania.myhome.cx/
−−−−−−−−−−−−−−−−−

やはり自宅サーバでないと難しいのだろうなと。

リストにk-1のディレクトリ(?)もありますので
k-1スレをまとめておられる方なのでしょうか(って詮索してる訳ではないです)

上記スレッドでお書きになられている事ですし
追加させて頂かせても良いかなとか思ったですが(「その35」かな)
何だかフラフラで
あれこれ訊いたり書いたりするのが凄く億劫な感じです
んもう疲れちゃって疲れちゃって。



根拠も何もない個人的私見なのですが
ひろゆきさんのお書きになられた

http://blog.livedoor.jp/hirox1492/archives/26498.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
2ちゃんねるをチェックするツールが多数ありますが、巡回ツールだったりするわけで、
更新チェックだと、チェックして見に行かなければいけないので、2度手間になると考えている人は
多い気がします。
常時接続が基本ですし、巡回にしてローカルに
溜めるというのもありなんじゃないかなぁと思う今日このごろです。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

> 巡回にしてローカルに
> 溜めるというのもありなんじゃないかなぁと思う今日このごろです。

これ まだ有効なのではないかと思うです。
みみずんさんを始めとして多数居られますし
突っ込まれる事はないのではないかと。

237 :名無しさん@勉強中 ★ :07/11/17 07:47:09 ID:???
http://namahage.dip.jp/public_s/
−−−−−−−−−−−−−−−−
namahage@2chlog は閉鎖しました。
2007/11/15
−−−−−−−−−−−−−−−−



お疲れ様でした

238 :名無しさん@勉強中 ★ :07/11/17 15:51:01 ID:???
>>236を追加させて頂いたです
別窓版や軽量版は様子を見つつ

239 :名無しさん@勉強中 ★ :07/11/17 18:59:27 ID:???
全てhtml化されておられる訳ではないみたいなので
dat.gzのリンクだけにしたです

gzファイルではプレビューとか出来ないので
gzip圧縮されたファイルにアクセス取得解凍して
php版dat2html経由で表示とか出来ればいいんですけど
そういうWebプログラムCGIってどこかにありそうなものですけど
実際 どこかにないですかね。
perlでもphpでもrubyでもpythonでもいいんですけど。
それ用のgzip解凍モジュールが必要なものでも
xreaなら何とかしてくれそうなので。

ところで
tatsuさん作のdat2htmlで
多段ポップアップやレス抽出も出来るスキン(?)なんですが
ポップアップはともかく
レス抽出ってIEだけなのでしょうか。
自分とこのBagelではウンともスンともしないですが。

240 :名無しさん@勉強中 ★ :07/11/17 19:34:14 ID:???
メモ

gzip圧縮転送について/Apache/CGI/Perl
http://tech.bayashi.net/pdmemo/gzip.html

241 :名無しさん@勉強中 ★ :07/11/18 08:59:42 ID:???
メモ

フォルダ スレッドの数
オカルト倉庫 51442
2ch.net 269246
bbspink.com 31332
html化済3項目 352020
DAT(gz) 386952

242 :名無しさん@勉強中 ★ :07/11/18 12:10:24 ID:???
さて
いっちょPythonでもやってみべかと
下のをdat化しようとしたですが
read.cgiそのままではあちこち抜けてるみたい(私の頭のようだ)
や、もしかしたらdatとかあるかもですが
まだ見とらんですよ。

http://www.geocities.jp/futasuke5/bbs/1061523335_part1



上のスレその他を読むと、Pythonって
MacやLinuxでは標準装備されてるっぽいですね。
Windowsだけは要インストールみたいですが。

って事は
今までwshで作ってある物をPythonに書き換えたら
非win環境の方にもOKになるかも。
何だか面白そうですね。

243 :名無しさん@勉強中 ★ :07/11/18 12:40:40 ID:???
何だ
>>242って元htmlの状態から抜けていたのか。
これでは指定レス番がズレてしまうではないですか。

244 :名無しさん@勉強中 ★ :07/11/18 12:53:34 ID:???
という事で要望を

http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/498

要望されても困るかもですが
必要無い or 面倒だと思われるのでしたらいいです

245 :名無しさん@勉強中 ★ :07/11/18 16:00:45 ID:???
メモ
2ch-imode(http://2ch-i.net/)のdat化


正規表現
m#<p>\[([0-9]+):(.+?)(?:≪(.+?)≫)? \((.+?)\) (?:<a href=.+?>AA</a>)?\]<br> (.+?)</p>.*?<hr>#mik

前処理
s#(<title.*?): 2ch-imode(</title>)#$1$2#k
s#<SCRIPT language="JavaScript">.+?</SCRIPT></body></html>##igk

変換結果式
メール欄逆転

後処理
s#(\n.*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk



>>90の正規表現ではマッチしなくなったようですが
これでどうでしょうか。

246 :名無しさん@勉強中 ★ :07/11/18 16:13:35 ID:???
後処理これではレス1にマッチしないですね。こうかな?

s#((?:^|\n).*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk


正規表現も半角スペースの有無とか よく見てないので
うまくいかないものもあるかも。
>>90のをもとにあれこれやってたら見事泥沼状態になったもんで
最初からやり直したです。

マッチしなくなった原因は何だろうなあ。
AAリンク前後の半角スペースとかなのかなあ。
頭にモヤがかかってるみたいでよくわかんないです。

247 :名無しさん@勉強中 ★ :07/11/18 22:29:50 ID:???
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/499

あらま
見られてましたかここ
了解です



それはともかく

あれから
>>242のスレッドから現在までのdatを取得して読んでみたですが
pythonですごい事をやられていたんですね。
画像取得や巡回のみならず
現在進行形でp2pでキャッシュ画像を融通しあったりしているみたいで
フォルダのサイズが2ギガとか4ギガとか結構いるみたい

スクリプトをDLして見ているですが
まだ全然何もわかんないです
まあわかんないまま終わっても構わないですけど。

248 :名無しさん@勉強中 ★ :07/11/18 22:57:33 ID:???
さっきまで最新版のほうを見てたですが

http://www.geocities.jp/futasuke5/

オリジナルを作られた作者さんの最終バージョンを見てみたら

http://heika-love.cool.ne.jp/futasuke.htm

サイズもファイル数も半分くらいで
此方のほうが少しだけわかりやすいかも。

p2p機能とかも面白いものですね。

http://futasuke.jf.land.to/howto.html



メモ

Python入門
http://www.f7.ems.okayama-u.ac.jp/~yan/python/
初歩の「Perl」「Python」「Ruby」 − @IT情報マネジメント
http://www.atmarkit.co.jp/im/carc/serial/redge60/redge60a.html
Python
http://osksn2.hep.sci.osaka-u.ac.jp/~taku/osx/python/index.html
Python チュートリアル
http://www.python.jp/doc/release/tut/

249 :名無しさん@勉強中 ★ :07/11/18 23:36:12 ID:???
2chlog公開停止の件
http://namahage.dip.jp/blog/archive/2007/11/18/98479.aspx

再度 お疲れ様でした。

> 復帰予定はありません。全く。回線止められるの嫌だし。

との事ですが
まあ自分とこはそのままにさせて頂こうかなと。


そういえば
MoonWolfさんの所も
やっとトップページから「2chミラー計画」のリンクをお消しになられたようで。

http://www.moonwolf.com/

250 :名無しさん@勉強中 ★ :07/11/18 23:48:17 ID:???
Twisted Mind
http://d.hatena.ne.jp/Voluntas/
perezvonの日記
http://d.hatena.ne.jp/perezvon/
グニャラくんのグニャグニャ備忘録@はてな
http://d.hatena.ne.jp/tasukuchan/

251 :名無しさん@勉強中 ★ :07/11/20 19:34:18 ID:???
いやーpython面白いわー。
後でインストールして試してみるかなー。


Kawasaq通信 いかにして効率よく大量のおっぱい画像をダウンロードするか。おっぱいマニア編
http://kawasaq.blog56.fc2.com/blog-entry-97.html
pythonでニコニコ動画のflvをダウンロードする
http://d.hatena.ne.jp/spacecadet/20070814/1187106008
コマンドライン上で動作するニコニコ動画ダウンローダー on Python
http://d.hatena.ne.jp/y_yanbe/20070827/1188160390
ニコニコ動画ダウンロードスクリプトその後
http://d.hatena.ne.jp/spacecadet/20070828#1188315993


何だかどちらもwshで書き換えられそうですね。実際誰かやってそう。
ただ どちらもバイナリファイルのダウンロードという事になるので
その場合 ADODB.streamを使うとなると
自分のPCでは 作ったとしても検証(カッケー!)出来ないです。
他の方法はないのかな。

252 :名無しさん@勉強中 ★ :07/11/20 19:44:31 ID:???
とりあえず容量食わないみたいですし
BASP21を入れてみるかな

http://www.b21soft.co.jp/basp21/basp21psocket.html#vbs_download

253 :名無しさん@勉強中 ★ :07/11/21 07:18:58 ID:???
別件で使えそうなのでメモ

http://d.hatena.ne.jp/spacecadet/20070814/1187106008
−−−−−−−−−−−−−−−−−−−−−−−−
#エスケープ文字を置換する
def unescape(strg):
strg = string.replace(strg,'%2F','/')
strg = string.replace(strg,'%3A',':')
strg = string.replace(strg,'%3D','=')
strg = string.replace(strg,'%3F','?')
return strg
−−−−−−−−−−−−−−−−−−−−−−−−

254 :名無しさん@勉強中 ★ :07/11/21 12:49:14 ID:???
BASP21入れてみたです。

すごいやこれ!(私が言っても何にもなりませんが)
ADODB.streamを使うほうが汎用的ですが
>>92の通り 追加モジュールのサイズが段違いに多いので。

で >>92でも書いたですが

> 何をしたいかというと
> 画像等のバイナリファイルを
> スクリプトでDL出来ないかというだけの事なんですが。

書いてあったサンプルをもとに実行してみたら
出来たです出来たです。




メモ

unibonのページ(unibon)
http://www.geocities.co.jp/SiliconValley/4334/unibon/index.html

更新止まってるように見えるですが
日記は現在進行中です

255 :名無しさん@勉強中 ★ :07/11/22 08:43:18 ID:???
メモ

Python標準リリース
http://www.python.jp/Zope/download/pythoncore
Python インストール ガイド
http://www.xucker.jpn.org/pc/python_install.html
Python Home
http://hp.vector.co.jp/authors/VA003670/python/
CodeZine:Pythonを始めよう(入門, Python)
http://codezine.jp/a/article/aid/1617.aspx
a geek
http://d.hatena.ne.jp/hiratara/
python.matrix.jp
http://python.matrix.jp/index.html


実際入れてみると
50メガくらい容量を使ってしまうみたい。
過信するほど詳しい訳でも頼りきってる訳でもありませんが
pythonで出来てwshで出来ない事ってあるのかな。
(↑問題発言かな)

wshだと ほとんどのwindowsマシンで標準装備されているから良いのですが
pythonだと>>242のようにMacやLinuxで標準装備されているというのが強みなのかな。
dat落ちしてますが、それぞれの板にスレッドがありますし。

MacでPython Part 1
http://pc7.2ch.net/test/read.cgi/mac/1105894574/
Python
http://pc8.2ch.net/test/read.cgi/linux/1078144088/



それにしても
クロスOS(とは言わないか)という事で考えたら
JavaScriptって凄いですね。
ほとんど全てのPCでOKだし
最近だと携帯でも少しづつ対応しているみたいですし。

+ JavaScript の質問用スレッド vol.61 +
http://pc11.2ch.net/test/read.cgi/hp/1194265231/288
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
288 名前:Name_Not_Found[sage] 投稿日:2007/11/18(日) 06:41:16 ID:???
今の携帯ってJavaScript使えるのかあ

すっかり時代に取り残されてしまった
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

256 :名無しさん@勉強中 ★ :07/11/22 13:39:20 ID:???
>>251から飛んだ先の説明文を読んで
proxomitronでクッキーとリファラーとUAを適当な値で送信するよう設定して
試しにやってみたら
nicovideo.jpのflvをDLする事が出来たです
すげーやこれ。
flvファイルってローカルで再生してもカクカクするですが
もうそこは私の旧型マシンの性能なのだろうなと。

これ本当にwshで出来そうですね。
ログイン時のSSL認証も
前スレ432や657のように何とかなりそうです。

まあ作ったところで
私しか使わないでしょうけど。

257 :名無しさん@勉強中 ★ :07/11/22 16:16:31 ID:???
うーむ
ターゲットのPOST先がよくわかんない・・・
まあ
proxomitronとブラウザの併用で十分かもです(←逃げ口上)

flvファイルのリンク抽出だけならwshで出来るかな?
ブックマークレットでも何とかなるかも。
やった途端に仕様変更とかあるかもですが。

258 :名無しさん@勉強中 ★ :07/11/22 18:15:20 ID:???
Yusukebe::Tech
http://yusukebe.com/tech/
Perlでニコニコ動画のflvとコメントxmlをダウンロードする (Yusukebe::Tech)
http://yusukebe.com/tech/archives/20070803/124356.html
ゆーすけべー日記
http://yusukebe.com/
ゆーすけべー日記: いかにして効率よく大量のおっぱい画像をダウンロードするか
http://yusukebe.com/archives/07/10/15/174049.html

やっぱギークでナイト!
http://geek.oyspe.com/
ギークなお姉さんは好きですか
http://lovecall.14.dtiblog.com/


いちばん最後のべにぢょさんは
はてなブックマークで何故か私の所があったっけだっけなと

259 :名無しさん@勉強中 ★ :07/11/22 20:01:04 ID:???
いやーpython難しいわー。
さっきインストールして試してみてるですが
とっかかりすら覚束ないー。
>>248>>251の諸スクリプトも全然動かないー。

何が足りないのかもわかんないー。
私の頭か?多分そうだ。



でも、htmlやJavaScriptやphpやperlやwshも最初はそうだったので
やってれば何とかなるかもですが
それらの言語と比べて資料やサンプルがWeb上にそう多くなさそうなので
何とも難しいです。
誰かに訊く訳にもいかないですし。

適当にやってみますか。

260 :名無しさん@勉強中 ★ :07/11/22 20:40:55 ID:???
というか
"Hello Python World"
の出し方からしてわかんないのですが
これって流石にどこでも訊けないですよね。

コマンドプロンプトやとIDLE(? 内蔵エディタみたいなの)では

print 'Hello Python World'

とやったら次の行に表示されましたが
pyファイルに書いて実行しても
(一行目は「#!/usr/bin/python/」 Windowsだと無意味そうだけど)
Dosプロンプトめいたものが一瞬出てすぐ消えるだけですが
これって正しい動作なんでしょうか。

正しい動作なのかもですが、では
プロンプト画面が消えないようにするにはどうすればいいのだろう・・・

まだチュートリアル見てないですが
sleepとかかな?

261 :名無しさん@勉強中 ★ :07/11/22 21:19:47 ID:???
・・・出来た。

Python
http://www1.u-netsurf.ne.jp/~merita/python/python20.html
−−−−−−−−−−−−−−−−−−−−−−−−−−
hello.py
---
#!/usr/local/bin/python
from Tkinter import *
Label(text='Hello, world!').pack()
mainloop()
---

−−−−−−−−−−−−−−−−−−−−−−−−−−


メッセージ表示するだけなのにこれは一体。
Tcl/Tkって何だろう・・・

262 :名無しさん@勉強中 ★ :07/11/23 00:19:07 ID:???
メモ
日本版googleで「Python」の検索結果を表示するコード

http://usamimi.info/~mirrorhenkan/2ch/python/prog/read.php?key=1081312810&st=435&to=435
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
import urllib, sys

ACTION = "http://www.google.co.jp/search"
DATA = "q=%(q)s&hl=%(hl)s&lr="
q = "Python"
hl = "ja"
urlopener = urllib.FancyURLopener()
urlopener.addheaders = [('User-agent', "Mozilla/3.0")]
print urlopener.open(ACTION + "?" + DATA % locals()).read()
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


結局、Pythonスレッドを検索するのが一番実用的な感じがするですが
もっとわかりやすいサンプルとかサイトとかないのかな

あと上のだと
結果表示がプロンプト画面で一瞬出てすぐ消えてしまうです。
ローカルに保存するのも、他言語と同じ要領で何とか出来る感じです。

で、画像とかのバイナリファイルのDL保存も
同じコードで何とかなるのでしょうか。
wshはそこがネックだったですが。

263 :名無しさん@勉強中 ★ :07/11/23 00:46:34 ID:???
http://usamimi.info/~mirrorhenkan/2ch/python/prog/read.php?key=1176059681&st=941&to=965

あとでじっくり読んでみよう。

264 :名無しさん@勉強中 ★ :07/11/23 09:33:11 ID:???
メモ
その15・その16のdat化について

URL例
http://snapshot.publog.net/dat.php?url=http://ex20.2ch.net/test/read.cgi/gline/1165245437/
http://snapshot.publog.net/dat.php?upd=y&url=http://ex20.2ch.net/test/read.cgi/gline/1165245437/

前処理
s#<title.*?/title>##
s#dc:title=\"(.*)\"#<title>$1</title>#

正規表現
m#<dt>([0-9]+).+?(?:"mailto:\.?(.+?)">)?<b>(.*?)</b>(?:</font>|</a>) :(.*?)<dd> ?(.*?)<br><br>(<dt>|</dl>)#mik

265 :名無しさん@勉強中 ★ :07/11/23 11:57:19 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1165245437/476

あう
アップし忘れてたです

バックアップとして旧ファイルをリネームして
新ファイルをアップしているのですが
リネームだけしてアップを忘れてしまっていたという塩梅で。


それにしても
最近、あちこちに御迷惑をおかけしているのだなと
少し罪悪感を感じている真っ最中なのであります

266 :USA, New York:07/11/23 12:26:48 ID:mArO8/K1
<a href=http://fpcmfopv.blogspot.com/ >nude teen amateur file sharing</a>
nude teen amateur file sharing http://fpcmfopv.blogspot.com/ nude teen amateur file sharing
[url=http://fpcmfopv.blogspot.com/ ]nude teen amateur file sharing[/url]
<a href=http://fxpwflpcx.blogspot.com/ >amature older</a>
amature older http://fxpwflpcx.blogspot.com/ amature older
[url=http://fxpwflpcx.blogspot.com/ ]amature older[/url]
<a href=http://22bfpmffwpp.blogspot.com/ >granny porn on viedo</a>
granny porn on viedo http://22bfpmffwpp.blogspot.com/ granny porn on viedo
[url=http://22bfpmffwpp.blogspot.com/ ]granny porn on viedo[/url]

267 :名無しさん@勉強中 ★ :07/11/23 13:46:24 ID:???
ふむ
nude teen amateur fileですか。
って こっちはまあ需要あるでしょうけど
問題はその下で

あのあの
amatrute olderiに
granny pornって何なのよと。
年輩や年増の女性のpornっていう事ですか?
だとしたら、何とも熟女たるものがありますねこの場合。

とはいえ そういう嗜好が世の中にあるのも間違いのない所で。
痴女とか逆ナンみたいなものもお伽話ではないでしょうし。

とか書くと
熟女板(http://sakura02.bbspink.com/mature/)や
フェチ板(http://pie.bbspink.com/feti/
等の住民の方々に怒られるかもなと。

それと
「amateur older」ではなく
「amature older」なのですか。
勉強になるなー。


という訳で
http://yy14.kakiko.com/test/read.cgi/mirror/1115213835/237
をつけたです。
あらあらかしこ

268 :名無しさん@勉強中 ★ :07/11/23 16:25:02 ID:???
この流れで貼っとこう

http://mousouteki.blog53.fc2.com/blog-entry-4879.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
110 名前:Cal.7743[sage] 投稿日:2007/11/08(木) 23:28:29
ったくどいつもこいつもバカだな。
セックスなど存在しない。神話といっしょで想像上の出来事だ。
チンコはおしっこをするためについているものだし、マンコなど存在しない。
好きな人ができても普通はキスまで。それ以上の行為は無い。
何を根拠にそんな暴論を吐くんだ?
お前はそのセックスとやらをしたことがあるって言うのかよ。そんな夢物語を。
流れ星を見ただけなのにUFO見たと言って大騒ぎするタイプだなw
UFOの意味は「未確認飛行物体」だ。実際にはきちんと確認されてないんだよ。
カッパとかも同じ。
UMA(ユーマ)と言って意味は「未確認」生物だ。
無学にして知らないが、おそらく「SEX」にも同じような意味があるのだろう。
意味は「未確認行為」といったところか。スペルが当てはまらないのが少し気になるが。
ビデオとかの映像もあれは偽物だぞ?
お前みたいにうかつに信じ込む奴がいるから面白がって誰かが作っているだけ。
その証拠に繋がってるとこにはモザイクとかついてるだろ?
そういうことなんだよ。
無修正の裏ビデオなども実はトリック。
最近はコンピュータによる映像処理の技術も進んできているからな。
イタチゴッコで切りがないが騙されないよう気を付けるように。
本当にあるのなら俺だってしてみたいよ。
そのセックスとかいうやつをなw
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


さあ元スレを探すのだ

269 :名無しさん@勉強中 ★ :07/11/23 16:41:00 ID:???
読んでる人が上見てひくかもしれませんが
この程度の事でひかれても。
そういう人って
モーツァルトの書簡集とか完全版アンネの日記とかも許容出来ないのかも とか。
(って何こいつ偉そう)


ちょっと本屋に行って立ち読みしてきたですが
pythonでWeb上のファイルにアクセスするには
urllibモジュールをimportしてから
urlparse()やurlopen()等をすればいいみたい。

それにしてもpythonの本少ないなー。
他の言語のは沢山あるですが。
サイトを出しておられる方も結構いらっしゃるですが
MacやLinux使いの方々ばかりですし
専門的な 頭痛が痛くなるようなサイトが多いです。
対して、その本屋では wshの本は皆無ですが
サイトを開いている凄い方が一杯居られるので
此方は何とかなってる感じ。

270 :名無しさん@勉強中 ★ :07/11/23 19:36:42 ID:???
あれれ

>>6
>>128
>>177
が使えなくなったみたい
まあいいや

271 :名無しさん@勉強中 ★ :07/11/24 08:28:54 ID:???
Programmer's Gate
http://morchin.sakura.ne.jp/index.php
Programmer's Gate / Effective Python /minidom
http://morchin.sakura.ne.jp/effective_python/minidom.html
プログラミング日記
http://d.hatena.ne.jp/morchin/
On Python
http://www.shido.info/py/index.html


pythonで大量のおっぱい画像をダウンロード出来るようになるのは
いつの事だろう
ハハハハハハハハ

272 :名無しさん@勉強中 ★ :07/11/24 08:44:35 ID:???
Dive Into Python
http://diveintopython.org/


どうして日本語が無いんだよー。
下の言語はあるのにー。

* Italian
* French
* Spanish
* Chinese
* Korean
* Russian

"Translations are freely permitted"
ってあるけど
自分には無理だよー。

273 :名無しさん@勉強中 ★ :07/11/24 10:11:20 ID:???
メモ

[Python] - veryberry_cafeの日記
http://d.hatena.ne.jp/veryberry_cafe/searchdiary?word=*%5BPython%5D

274 :名無しさん@勉強中 ★ :07/11/24 11:24:46 ID:???
tomoemonの日記
http://d.hatena.ne.jp/tomoemon/
BOON SUTAZIO ⊂二二二( ^ω^)二⊃ ブーン スタジオ
http://d.hatena.ne.jp/boonvoyage/
FrontPage - Pythonのお勉強
http://python.rdy.jp/wiki.cgi?page=FrontPage

275 :名無しさん@勉強中 ★ :07/11/24 11:26:19 ID:???
Python Home
http://hp.vector.co.jp/authors/VA003670/python/
テキストファイル
http://hp.vector.co.jp/authors/VA003670/python/FileIO/TextFile.htm
バイナリファイル
http://hp.vector.co.jp/authors/VA003670/python/FileIO/BinaryFile.htm

276 :名無しさん@勉強中 ★ :07/11/24 11:40:16 ID:???
ああ、やっと
pythonでWeb上のデータを
ローカル保存出来た・・・
感動。

Mac使い or Linux使いの方居られますか?
って ココに書いても反応は期待出来ないかもですが。

277 :名無しさん@勉強中 ★ :07/11/24 17:32:11 ID:???
ちょっくらpythonで書かれた CGIを表示させようと

http://mirror.s151.xrea.com/

にFTP接続してアップしようとしたら
容量満杯だそうで。

でもpublic_html内のサイズは何度やっても35メガくらいだもんで
おかしいなと調べてみたら
自動生成されてるlogフォルダが15メガくらいあったです。
5日分あって
1ファイルが3MBくらい。

これってApatch(?)が吐き出す生ログみたいなんですけど
どうすればいいんでしょう。
消しちゃって問題ないのかな。

278 :名無しさん@勉強中 ★ :07/11/24 18:42:16 ID:???
datファイルを共有するP2Pソフト o2on 12dat
http://pc11.2ch.net/test/read.cgi/tech/1180440415/366
−−−−−−−−−−−−−−−−−−−−−−−−−−−
366 名前:デフォルトの名無しさん[sage] 投稿日:2007/11/24(土) 17:36:41
PC我物故我他ので色々再インストール中なんだが
Janeの右クリックでどっかから過去ログ持ってこれるソフトはなんだっけ?
このスレで知った気がしたんだが
o2onも入れるからおしえてくり

367 名前:デフォルトの名無しさん[sage] 投稿日:2007/11/24(土) 17:48:14
>>366
漏れが作ったソフト
既に消えている
要望があったら再うpする

368 名前:デフォルトの名無しさん[sage] 投稿日:2007/11/24(土) 18:12:24
p2todatか
−−−−−−−−−−−−−−−−−−−−−−−−−−−


p2todat配布停止されてたのかなとgoogle検索から行ってみたですが
まだ配布しておられるような。
mimizun.jsも おささんの所にありますし
となるとgetlog.wsfの事なのだろうか。

でもgetlog.wsfの作者さん、jane外部コマンドスレで何回かお見かけしたですが
一人称で「漏れ」というような文章をお書きになられるような方には見えなかったですが。
続報求む

279 :名無しさん@勉強中 ★ :07/11/24 20:20:35 ID:???
という事で
>>276を出してみるです

http://www.geocities.jp/mirrorhenkan/others/python/getimg.py.txt

pythonが入っているマシンの方のみですが
上のコードをDLして拡張子をpyにリネームして実行してみて下さい。
スクリプトと同じフォルダにyahooのタイトル画像が生成していたら成功です。

pyファイルの実行方法ですが
・ダブルクリック
・コマンドライン
・GUI (IDLE)
の3種類あるみたいです。


あと、Mac/Linuxの方は
スクリプト1行目の

#!/usr/bin/python



#!/usr/local/bin/python

または各自のpython設定先に書き換えなければいけないかも。


この程度のスクリプトでも、まんま書いてある所がなかったので
なかなか勉強になったです。
自分とこではうまくいったですが
他のところではどうでしょうか。



反応があったら嬉しいのですが。
という事で、お願いします。

280 :名無しさん@勉強中 ★ :07/11/25 04:27:49 ID:???
Python入門
http://www.f7.ems.okayama-u.ac.jp/~yan/python/
Japanese Python Links
http://homepage1.nifty.com/kazuf/pythonlinks.html
機械伯爵の最新Python講座
An Introduction to Python & IronPython
http://www.okisoft.co.jp/esc/python/iron-python-intro.html
Python
http://ar.aichi-u.ac.jp/python/
九十九のぶろぐ:Python
http://sima8921.exblog.jp/i14/
WisdomSoft - Python言語入門【Python言語】
http://www.wisdomsoft.jp/dev/prog/python
猫日誌 -2005-
http://mineko.fc2web.com/box/my-room/dialy/privateDialy2005kisaragi.html

開発者のためのオンライン参考書
http://hp.vector.co.jp/authors/VA003670/index.html

281 :名無しさん@勉強中 ★ :07/11/25 08:39:17 ID:???
>>279ですが
どこか外部に晒したほうが反応が見込める。かもしれず。
かといって
チキンなので
凄い方が沢山居られるプログラム板pythonスレで訊いてみるのも二の足を踏むですし


あと

http://blawat2015.no-ip.com/~mieki256/diary/20071003.html#200710030
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
「なんだこの書き方は。なっちゃいねえプゲラ」とか優越感ゲームしてる暇があるなら
添削してブログ公開して共有知にしてくれると嬉しいかもしれず。などと思わないでもない。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

pythonでの画像処理について調べていたのですが
まったく同感だなと。

282 :名無しさん@勉強中 ★ :07/11/25 11:09:50 ID:???
おおこれは!!

中国2CH (http://cn2ch.cn/)
http://cn2ch.cn/
中国■2ch BBS ..
http://cn2ch.cn/bbs/

コスプレとか漫画とか御宅とかあって
何だか馴染めそうな感じです。
簡体字なので少しとっつきにくいですが。
掲示板もUTF-8なのですが
dat直読みは開放してないみたい。
して欲しいな。

管理人さんのブログがMySQLエラーで読めないのですが
是非読んでみたいです。

283 :名無しさん@勉強中 ★ :07/11/25 11:43:56 ID:???
dat直読みは開放してないといっても
windowsサーバでIISを使ってるみたいですから
パーミッションとかではないみたいだし



メモ
双葉スクリプト中文化配布サイト
これで双葉中文化サイトは3つめなのかな
各々関係のないスタンドアローンでしょうし

Pixmicat! in Development
http://pixmicat.openfoundry.org/


それにしても
台湾のサイトは皆軽いのに
なんで大陸中国のサイトは重いのだろう。
インフラがまだ整備されてないのかな。
あるいは端的に国力の違いという奴なのだろうか。

国際電話も
通話料は何故かアメリカの倍くらいかかるみたいだし。

284 :名無しさん@勉強中 ★ :07/11/25 15:59:12 ID:???
さて次は
ダウンロード or ローカルのdatを正規表現その他でhtml化する
python版dat2htmlが出来たら面白そうだなと。
誰かがとっくにやってそうですがそういうのはどうでもいい話で
html化が出来た場合
Web上でのpythonCGIでのdat2htmlも出来るかもです

ほんとはpythonでhtmltodatのようなものが出来れば
非win環境の方でもdat取得出来そうだなーとか思うんですが
そちらのほうは少し敷居が高そうなので。




と書いただけで終わるかもですが
まあどうでもいいわな

285 :名無しさん@勉強中 ★ :07/11/25 18:13:42 ID:???
メモ

http://yusukebe.com/tech/archives/20070803/124356.html

を片手に頭の整理


URL
http://www.nicovideo.jp/watch/sm1049327


・スクリプト起動
|
・inputbox→URL入力
|
http://www.nicovideo.jp/api/getflv?v=sm1049327 にアクセス
|
・response.text取得→URL整形
|
・inputboxで整形後のURLを表示&クリップボードコピー

286 :名無しさん@勉強中 ★ :07/11/25 19:39:27 ID:???
>>282
ブログも読めたです
音楽が流れていますが
結構良いではないですか。

http://cn2ch.cn/blog/
http://xasm.yo2.cn/

JaneNidaで読めたらなあ。

287 :名無しさん@勉強中 ★ :07/11/26 17:23:08 ID:???
/*
  私信:
 メールを送らせて頂きましたので
  宜しかったら試してみて下さい
*/


さて
>>285をもとに
nicovideo.jpからflvファイルを半自動で取得するwshが出来たですが
どうしたものだろう・・。

perlやphpやrubyやpythonで作られた方々のコードを参考に
あれこれやって何とかなったっぽいですが

wshって 上記諸言語と違って
ほとんどのPC(win機)で標準装備されてるもんで
という事は 色んな人がそのまま使えてしまうかもなので
サーバへの負担やら帯域やらが心配になってしまうです
帯域が凄くてまた方式が変更になったりしても何ですし。
まあSmileDownloaderとか他にも色々あるでしょうけど
あと 車輪の再発明の域を出ていないものだという事もありますし。



うん
自分だけで使おうか

288 :名無しさん@勉強中 ★ :07/11/27 09:17:02 ID:???
うう
>>287って
今読んでみたら
恥ずかしい事を書いてしまったかもだ・・・

perlやphpも スクリプトの検証用(カッケー!)に入れているですが
サイトで使うCGIはともかくとして
Web上で出されているものって
例えばLWPとかCookieとか用の諸モジュールを追加インストールしないといけないものが多いので
なかなか試そうという気にはならないのです。
>>251のpythonスクリプトもmechanizeモジュール(?)を入れないと動かないみたいですが
入れてみてPCが動かなくなっても何ですし。
そう考えると wshって結構すごいかも。

自分のPCが んもうパッツンパッツンなので
なるべく追加インストールせず
標準装備されているものだけでやってみたいのですが。
って こんな事では
例えばDelphiとかC言語とか手を出せないじゃないかとか思ったりして。




ああ また恥ずかしい事を書いてしまったかも
(なら書くなと)

289 :名無しさん@勉強中 ★ :07/11/27 10:09:17 ID:???
VBSで便利なプログラムを作れスレ
http://pc11.2ch.net/test/read.cgi/tech/1170492587/59-67
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
59 名前:デフォルトの名無しさん[] 投稿日:2007/11/26(月) 08:03:28
BASP21でダウンロードソフトを作ろうと思っているんですが、
FTPだとFTPサーバーの名前を知らないとアノニマスでも接続できませんよね?
どうすれば良いのでしょうか?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

ちょうどBASP21で画像等のバイナリファイルをDLするスクリプトとか
面白いかなと見てたんですが
えーと
以下略

てかwin2000以上なら
BASP21を入れずともwshだけで何とでもなると思うです
私のPCだとダメですが。

290 :名無しさん@勉強中 ★ :07/11/27 21:27:33 ID:???
RubyもMacOSに標準装備されるのかなと

試験前だからプログラミングスレ
http://yutori.2ch.net/test/read.cgi/news4vip/1196066303/62
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
55 名前:以下、名無しにかわりましてVIPがお送りします。 [] 投稿日:2007/11/26(月) 21:09:54.60 ID:onQpvCMa0 (PC)
将来性はどのスクリプト言語がよさそうですか?
jscriptみたいになるのはどれだと思いますか?

62 名前:以下、名無しにかわりましてVIPがお送りします。[sage] 投稿日:2007/11/26(月) 21:28:32.46 ID:sHVCrD300
>>55
Rubyは?
いいとこ取りの言語らしいから今後期待できるかも。
すでに結構広がってるけどwwww
Mac OS X v10.2以降では標準で入ってるらしい
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


って
このレス見ただけなんで
ホントかどうか調べてないんですが。
まあ事実かどうかわかるまでは「ソースは2ch」って事で。

291 :名無しさん@勉強中 ★ :07/11/27 21:46:41 ID:???
ふむ
py2exeを使えば
非python環境でも使えるようになるみたい

http://pc11.2ch.net/test/read.cgi/sec/997431887/758
http://dukedog.flnet.org/pukiwiki/index.php?%A5%D6%A5%ED%A5%C3%A5%AF%A5%EA%A5%B9%A5%C8#manaita

292 :名無しさん@勉強中 ★ :07/11/27 22:04:21 ID:???
メモ

Python @ 7bit
http://nanabit.net/softwares/python.html


此方で勉強させて頂こうかな。

というか
python版htmltodatも既にお作りになられてるではないですか。。

293 :名無しさん@勉強中 ★ :07/11/28 00:47:56 ID:???
コマンドプロンプトでの実行方法がわからない・・・

294 :名無しさん@勉強中 ★ :07/11/28 01:33:19 ID:???
>>279ですが
何だかDLして実行してみても動かなかったので直したです

コメント文の箇所(行頭にシャープ「#」をつけるやつ)でエラーが出ておったのですが
いったい何でなのでしょう

295 :名無しさん@勉強中 ★ :07/11/28 02:15:36 ID:???
うーん困った
pythonでのコマンドラインからの実行方法がほんとにわかんない
検索してもよくわかんない
こういうのって誰にきけばいいのだろう

明朝までにやんなきゃいけない事があるのに
なかなか手につかぬ
困ったほんと困った

296 :名無しさん@勉強中 ★ :07/11/28 18:37:21 ID:???
さて>>282ですが
やはりJaneNidaで読んでみたいです

思いつく手段を適当に書くと
・JaneNida作者さんに対応してもらう
・htmltodatをUTF-8対応してもらう(ユニコード用鬼車dllもありますし)
・xyzzyで一つづつdat化
・htmltodatプロキシ的CGIを作って(http://usamimi.info/~shukeisho/みたいな)
 それ経由(& proxomitron経由)で閲覧する
・htmlをdat化しつつDLするようなスクリプトを作る

最初二つは無理でしょうね。
となると後ろ二つですか。

297 :名無しさん@勉強中 ★ :07/11/30 02:12:00 ID:???
メモ

MacでPython入門
http://www.hlj.com/~tanoue/Python/Mac/mpy00.html
ニシキヘビを飼おう python入門
http://www.f7.ems.okayama-u.ac.jp/~yan/python/
僕と僕のサル以外、みんな何かを隠してる
http://xwave.exblog.jp/
HMDT - Back Number / June, 2001
http://homepage.mac.com/mkino2//backnumber/2001_06.html
続・おもむろに Python の勉強をはじめてみる - 星一の日記
http://d.hatena.ne.jp/hajimehoshi/20070609/1181378283

298 :名無しさん@勉強中 ★ :07/11/30 02:36:16 ID:???
>>260-262
「画面が一瞬だけ表示されて消える」事に対する対処法ですが

虚ろなる破壊への夢 Python
http://www.naoto.tv/pc/python/py_01.html
−−−−−−−−−−−−−−−−−−−−
#! /usr/local/bin/python

print "Hello World!"
input("OK?")
−−−−−−−−−−−−−−−−−−−−

なるほど。
データ入力方法もわかりました。

print raw_input("write something")


ただ、私の環境では
コメント中の日本語であってもエラーが出てしまうみたい。
間違っているのかな。

299 :名無しさん@勉強中 ★ :07/11/30 09:48:31 ID:???
>>298ですが
一行目で書いたpythonのパスの次行に

#coding:shift_jis

を書いたら、日本語も表示出来るようになったです。

本当は

# -*- encoding: shift_jis -*-

とやったほうが良いのかもしれないですが。

300 :名無しさん@勉強中 ★ :07/11/30 09:54:19 ID:???
メモ

Python Home
http://hp.vector.co.jp/authors/VA003670/python/
文字列の検索
http://hp.vector.co.jp/authors/VA003670/python/RE/Search.htm
Pythonはじめました
http://www.kototone.jp/com/python01.html
Python - TSNETWiki
http://www.rakunet.org/TSNET/pukiwiki/?Python
Pythonドキュメント翻訳プロジェクト
http://www.python.jp/Zope/pythondoc_jp/
リンク集
http://www.python.jp/Zope/links
日本の Python サイト
http://www.python.jp/Zope/links/japanesesite
Pythonソフトウェア作法
http://www.python.jp/Zope/articles/SoftwareTools
わたしの愛した機械
http://www.kototone.jp/com/index.html


ブックマーク替わりという事で。
やっとブラウザを閉じられる・・・

そういえば
讃岐さんも ソーシャルブックマークサービスを始められるみたい。

301 :名無しさん@勉強中 ★ :07/12/02 11:36:25 ID:???
中国の掲示板
http://chinabbs.seesaa.net/

中国の掲示板: 日本語を勉強すると白い目で見られる
http://chinabbs.seesaa.net/article/51692218.html#more
百度_日??_周???我学日?
http://bbs.baidu.com/f?kz=230385104


これって簡体中文なんですが
やはりJaneNidaで読んでみたく思ったです。
文字コードを見ると「gb2312」との事なので
何らかの方法でUTF-8に変換してからdat化すれば
文字化けもしないんじゃないかなと。
cjcode.plで変換するなりxyzzyで読み込んでUTF-8保存するなりして。


上に挙げたブログを読んでみると
実に様々な掲示板(フォーラムといったほうがいいのかな)から引用されているですが
同様に専用ブラウザで読んでみたいなと。



・・・自分で何とかするしかないのかな。。

302 :名無しさん@勉強中 ★ :07/12/02 12:00:39 ID:???
メモ

http://takatyan.ddo.jp/test/read.cgi/main/1192376543/42

検索結果URL
http://takatyan.ddo.jp/title_search.cgi?query=検索ワード

303 :名無しさん@勉強中 ★ :07/12/02 13:04:26 ID:???
関連で

Google Custom Search Engine - Site search and more
http://www.google.com/coop/cse/

これでwebarchive内のスレッドも検索出来れば面白いのですが。

現状、dumper.jpさんの所にあったログって探しようがないですし。
webarchiveに結構残ってるみたいなんだけど。

304 :名無しさん@勉強中 ★ :07/12/02 13:12:52 ID:???
webarchive関連といえば
下記フィルタをproxomitronに入れると文字化けしないです

[HTTP headers]
In = TRUE
Out = FALSE
Key = "Content-Type: Fix WebArchive Encode (in)"
URL = "web.archive.org/web/[0-9]+/.+"
Match = "(text/html)\0; charset=*"
Replace = "\0"



あと404だったり403だったり503だったりした場合にはこれ

[Patterns]
Name = "Error Page to Cache Page (2006-12-08 +1)"
Active = TRUE
URL = "$RESP((403|404|503)*)|$KEYCHK(C)"
Limit = 64
Match = "$RESP(\0)$STOP()"
Replace = "<h1>  \0</h1>  \n"
"<a href="http://web.archive.org/web/*/\u">Internet Archive</a>  \n"
"<a href="http://www.google.co.jp/search?q=cache:\u">Google cache (co.jp)</a>  \n"
"<a href="http://www.google.com/search?q=cache:\u">Google cache (com)</a>  \n"
"<a href="http://megalodon.jp/?url=\u">ウェブ魚拓</a>"



どちらもproxomitronスレで教えて頂いたもので
すごく感謝しつつ入れさせて貰っています

305 :名無しさん@勉強中 ★ :07/12/03 23:41:37 ID:???
いやーpythonすげーやすげー。
こんな事もあんな事も出来るのか。


python版dat2htmlは意外に簡単に出来そうです。
python版htmltodatのほうも 無い頭を絞ればできるかもしれない
てか そう思ってなきゃ 何も出来やしない
まあ口だけで終わってしまっても別にいいんですが。


問題は、作ったスクリプトが
自分とこでうまく動いたとしても
LinuxやMac環境で使えるのかどうかという事で。

あと、同じwindowsでのpython環境でも
色々バリエーションがあるようで。
本家Pythonおよび日本語移植Pythonのみならず
ActivePythonやらIronPythonやらあるみたいなんですが
果たして同じ動作をするのだろうかと。

306 :名無しさん@勉強中 ★ :07/12/04 08:24:50 ID:???
と書いてから>>292のpython版html2datを思い出したので
今朝やってみたら


使えるではないですか!!


正規表現は
htmltodatでいうところの「read.cgi.7.00?」決め打ちみたいですが
これはその箇所を書き換えれば良いだけの話で。

という事で
>>282もこれを用いてdat化出来そうです。
文字コードUTF-8にして
スクリプト中のコード指定も

# -*- encoding: shift_jis -*-



# -*- encoding: UTF-8 -*-

にして
適当な正規表現に書き直して実行すれば良さそう。

307 :名無しさん@勉強中 ★ :07/12/04 21:01:57 ID:???
いずれにしても正規表現を書かなければdat化出来ぬ
こうかな

URL
http://cn2ch.cn/bbs/test/read.cgi/cn2ch/1169813975/

正規表現
m#<dt><input.+?><a.+?>([0-9]+)</a>.+?<b>(?:<a href="mailto:(.+?)">)?(.+?)(?:</a>)?</b>(?:</font>)? (.+?)<dd>(.+?)<br><br>(<dt>|</dl>)#mik

後処理
s#((?:^|\n).*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk
wu G:\DOEVIEW051128\NIDAUTF8\NIDA070202\Logs\2ch\中国2ch\cn2ch\1169813975.dat


後処理のwコマンドはhtmltodat-convert.wsfで自動生成したものですが
UTF-8保存しないといけないので(付加機能感謝です)
「wu」としないと文字化けするです。

で、これでいいと思うんですが
Shift_Jisの文字コードでは存在しないような簡体中国文字フォントの部分が
ことごとく「????」になってしまうのは
さてどうしたものか・・・
逆に 例えばレス115等は何の問題もなく変換できてますが。
簡略化されて骨と皮みたいな感じの漢字とはいえ
或る程度内容を理解する手助けになる訳だし
選択して外部コマンドで飛ばして翻訳する事も出来るので何とかしたいところ。


python版html2datを
それ用にプチハック(カッケー!)するしかないのかな?
これって、フォルダ内一括dat変換とかも出来るようですし
改めてwshで車輪の再々発明とかするような気にもならんです

308 :名無しさん@勉強中 ★ :07/12/05 12:42:10 ID:???
Python で日本語を扱う基本をまとめてみるメモ(その1) - 猫(=・ω・=)顔 1.0β
http://d.hatena.ne.jp/nyagao/20070805/1186314723

309 :名無しさん@勉強中 ★ :07/12/05 19:31:17 ID:???
・・・よし、上手くいったかも。
dat化したものをJaneNidaの該当フォルダに入れてに見てみたところ
文字化けも無い感じ。
ただ、TeraPad/xyzzyどちらで開いても
最初Shift_Jisで認識してしまいますね。
まあ大勢に影響は無さそうですが。

では適当なhtmlをDLしてdat化して
読んでみますか。

310 :名無しさん@勉強中 ★ :07/12/05 19:54:28 ID:???
>>292のスクリプト中の正規表現なんですが
43行目あたりの

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
# <dt>〜(?=<dt>)抽出
mo = re.match('.*?<dt><input.+?><a.+?>(.*?)<br><br>((?=(<dt>|</dl>)).*)', htmlstr)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

ここで前スレ754で少し触れた肯定先読みの式を使ってるんですけど
これってどういう意味なのでしょうか。
Bregexp.dllとかで使えない使い方だからか 検索してもよくわかんないです


というかそれ以前に
上のって
カッコの中にカッコがあって
更にカッコがもひとつあるんですが
んもう頭がこんがらがってしまってるです

311 :名無しさん@勉強中 ★ :07/12/05 20:12:10 ID:???
という事で
非windows環境での諸ミラーサイトのhtmlを各自dat化してもらうような事も
何とかなりそうですね。
MacやLinux(Fedora系だけかな)でPythonが標準装備されているそうですし。

ただ、実際に使えるかどうかは
誰か試して下さる方が出てこない事にはどうにもなりませんが
今のところ そういう方も居られないようなので
気が向いたらそのうちやってみようかなと。

312 :名無しさん@勉強中 ★ :07/12/05 20:28:06 ID:???
と書いてからpythonスレを巡回してたら

Pythonのお勉強 Part22
http://pc11.2ch.net/test/read.cgi/tech/1196426978/58
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
58 名前:デフォルトの名無しさん[] 投稿日:2007/12/05(水) 18:44:02
2chのログを保存しているサイト(みみずん、snapshot 2ch等)からログを引っ張ってきて、
dat形式に変換してローカルに保存したいのですが、
自分がうんこ野郎なので、webサイトから何かしらのデータを取得する方法が分かりません。
主にどのようなライブラリを使えば良いのでしょうか?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


何というタイミング・・・


とりあえず58さんの環境を知りたく思ったですが
python初心者の自分が出てもグダグダになるだろうなと

313 :名無しさん@勉強中 ★ :07/12/06 17:13:51 ID:???
windowsをお使いの方みたいですね。
とりあえず投稿してみようかな


さて
出来たです。やったー。

http://www.geocities.jp/mirrorhenkan/others/img/cn2ch20071206.png

で、これをやっているうちに
右上窓のほうでも外部コマンドが出来ればいいなと思ったです。
あと それとの絡みで
やはりwshでhtmltodatみたいなスクリプトを作ったほうが
今まで作ったものを一部流用出来るなーと。

314 :名無しさん@勉強中 ★ :07/12/08 08:03:50 ID:???
さて
やはり動的に取得したいなと
phpでhtmlをdat化するプロキシCGIを書いてみましたが(てかツギハギコピペ^^;)
これをJaneNidaで読み込ませるにはどうしたものでしょう。

あとで要望してみますか。

315 :名無しさん@勉強中 ★ :07/12/08 17:55:35 ID:???
作ったものはこちら

http://mirror.s206.xrea.com/x/htmltodat/?url=http://cn2ch.cn:80/bbs/test/read.cgi/cn2ch/1172006580/

dat化の対象htmlはこれ

http://cn2ch.cn:80/bbs/test/read.cgi/cn2ch/1172006580/

で、問題なんですが

これをproxomitronで読み込んだ場合
なぜか上のスレだけ レス1の本文が表示されないのです。
ポップアップでは表示出来るので不思議。
ちなみに他のスレではOKなのでなお不思議。
UTF-8のdatはJaneNidaでしか読み込めないので
他で訊けないのだよなー。

それと、思い上がる訳ではないのですが
こんな事やってる方ってそうそう居られないと思うので
要望して、万一「需要はあるの?」とか言われたら返答に困りますし。

316 :名無しさん@勉強中 ★ :07/12/08 18:30:02 ID:???
さて次は
wshでhtmltodatのようなものですかね。 (←書いただけかも)
cn2chのような dat直読み出来ない板を専用ブラウザで読みたい場合
dat化CGI経由よりはDLして自前dat化させるほうが
自給自足的で良さそうじゃないですか。

何より、文字コードUTF-8で
繁体・簡体その他の文字混じりのhtmlをdat化させようとしても
現状 誰もやってくれなさそうですし。
仕方無いので独りコツコツと暗中模索するしかない。


と書いただけかも。

317 :名無しさん@勉強中 ★ :07/12/08 19:48:30 ID:???
要望を書かせて頂いたです

http://pc11.2ch.net/test/read.cgi/software/1195310686/358

もし、datの位置をある程度自由に設定出来るようになったとしたら
megaBBSをはじめとして 結構多くの掲示板が読めるようになるのではないかなと。
で、それ以外の形式の掲示板でも
dat化CGI経由で読み込むように設定すれば(dat化CGIは作らなければいけないですが)
ものすごく選択肢が拡がるのではないかと思うです。
まあスルーされたらそれまでの話ですけど。


で、>>315のdat化スクリプトも出しておくです

http://mirror.s206.xrea.com/x/htmltodat/htmltodat.phps

正規表現の箇所と次の始端(この場合は「<DT>」)のところを変更すれば
他のhtmlにも使えると思うです。
前処理・後処理・変換結果式等はつけてないですが、まあ何とかなるのではないかと。

それにしても、慣れているからか
他言語と比べて phpは理解し易いなー。

318 :名無しさん@勉強中 :07/12/09 00:21:37 ID:bZpZAxtN
プロキシでhtmlからdatに変換しつつ取得する場合、
「差分取得」は原理的に無理ですよね?

であれば毎回全部取得するしかないと思うのですが
Janeの場合、レスポンスが206でなく200の場合
(Range: が指定されていない場合かも)
内部で自動的に差分だけをマージするような動作を
してくれていたと思うのです。

以前様なプロキシを作った経験より。

319 :名無しさん@勉強中 ★ :07/12/09 12:16:17 ID:???
何だか大変な事に首突っ込んじゃったかなぁ・・・
まあ頭の体操という事で。

>>318
これはこれは。先輩ですね。
どの言語でプロキシをお作りになられたのか知りたかったり。


> プロキシでhtmlからdatに変換しつつ取得する場合、
> 「差分取得」は原理的に無理ですよね?

「原理的に無理」という事はないと思うです。
例えば したらば掲示板とかdatの差分取得出来てますし。

例を出すと、例えば下記スレ

http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/

これのdatは下記

http://jbbs.livedoor.jp/bbs/rawmode.cgi/computer/1929/1038588508/

つまり、したらば掲示板のdatは
httpリクエストがあったら リダイレクトなり何なりして
datを都度生成(=リダイレクト)する 動的なものだと思われます。
とはいえレスポンスヘッダ(カッケー!)を見ても
ステータスコード304や200や206を返してますし
Content-Lengthも返ってきており
差分取得も 問題なく出来ているので。


この辺りの事って、したらば掲示板作者のけんすうさんに
訊いてみてもいいかもですが
まあいいや・・。

ロケスタ社長日記
http://blog.livedoor.jp/kensuu/
けんすうライフログ
http://d.hatena.ne.jp/kensuu/
ひとり開発ブログ
http://blog.ideami.jp/

320 :名無しさん@勉強中 ★ :07/12/09 12:50:02 ID:???
繰り返しになりますが
他言語では判りませんが(したらばはperlかな)
phpでは出来なくもないかなと。
少なくとも「原理的に無理」という事は無いと思うです。


差分取得の場合、
・If-Modified-SincenリクエストによるLast-Modified(ファイルの更新時間)取得
・ステータスコードの戻り値(更新ならHTTP/1.1 206 Partial Contentだったかな)
・Range: bytes

を見ているように思えるので
そのようにヘッダを返してやるだけで良いと思うです。
phpのheader命令に適切な値を入れれば良さそう。
詳しくは下記

header
http://php.s3.to/man/function.header.html


>>317のスクリプトソースでいうと

header("Content-Type:text/plain");

に続いて
例えば

header("HTTP/1.1 206 Partial Content");
header("Last-Modified: Sat, 08 Dec 2005 14:25:19 GMT");
header("Content-Length: 3378");

とやれば(したらばdatのように)静的ファイルのようなレスポンスを返せそうですし
従って差分取得も可能になるのではないかと。

試しにやってみましたが
書いた通りのヘッダやステータスを返してますね。

http://mirror.s206.xrea.com/x/htmltodat/test.php


ソースは下記
スレッドのタイトルを取得するテストに使ったものの再利用ですが。

<?php
$url = "http://cn2ch.cn/bbs/test/read.cgi/cn2ch/1169813975/";
$source_array = file($url);
$source = join("", $source_array);
eregi("<title.*>(.*)</title>", $source, $title);
header("HTTP/1.1 206 Partial Content");
header("Last-Modified: Sat, 08 Dec 2005 14:25:19 GMT");
header("Content-Length: 3378");
echo $title[1];
php?>

321 :名無しさん@勉強中 ★ :07/12/09 13:02:36 ID:???
>>319追加

100日プログラミング
http://100prog.com/

けんすうさん、phpを始めて100日足らずとの事ですが
やはり凄いなと。

って、そういえば
自分もpython始めてまだ3週間足らずだけど
比べちゃいかん

322 :名無しさん@勉強中 ★ :07/12/09 13:20:32 ID:???
>>320続き

もしやるとすると

・dat化プロキシにhttpリクエスト

・dat化させたものの最終レスの時間をGMT化してlast-modifiedに格納
 httpリクエストのIf-Modified-Sinceの時間の項目と比較:
 項目そのものが無かったらステータス200
 同じならステータス304
 違っていたらステータス206

・ステータス200 or 206の場合
 dat化したテキストファイルのバイト数を取得して
 Content-Lengthに格納

・レスポンス


この流れで良いのではないかと。
まあやってみないとわかりませんが。


・・・というか
今日は時間がとれなさそうなんですが・・・。

323 :名無しさん@勉強中 ★ :07/12/09 14:27:04 ID:???
ところで>>320のソースなんですが

eregi("<title.*>(.*)</title>", $source, $title);

の正規表現の部分、
ほんとは最短一致で

eregi("<title.*?>(.*)</title>", $source, $title);

とやりたかったんですが
こうやると「eregiの書式が変です」みたいなエラーが出るのですが
何でなのでしょうか。
php特有の問題なのかな。
phpでは最短一致の「?」って使えないんでしょうか。

ここ見てるかもしれない人でphpに詳しそうな方というと
com-nika.osask.jpのnikaさんとか
2se.dyndns.orgのsyoboonさんとか
namahageのひろせあさんとかですかね。
sane.justblog.jpの實松アウトプットさんも見てるかもしれないですが。

324 :名無しさん@勉強中 ★ :07/12/09 15:22:57 ID:???
書いたです
ちょっと余裕が無かったので>>317を自己コピペしたりして

http://pc11.2ch.net/test/read.cgi/software/1195310686/383

でもこれって、読む人によっては
顔を真っ赤にして涙目になりながら
必死に反論しているような文章に見えるのかもしれないなぁ
全然そんな事はないんだけどなぁ

325 :名無しさん@勉強中 ★ :07/12/09 16:03:50 ID:???
>>318後半
> Janeの場合、レスポンスが206でなく200の場合
> (Range: が指定されていない場合かも)
> 内部で自動的に差分だけをマージするような動作を
> してくれていたと思うのです。

という事は、
datファイル(のようなもの)が更新されているorローカルに該当datが無い場合は
どちらでも200を返しておいてもいいという事ですか。

あと実は
「マージ」ってよくわかんなかったり。

http://www.google.com/url?sa=t&ct=res&cd=1&url=http%3A%2F%2Fe-words.jp%2Fw%2FE3839EE383BCE382B8.html&ei=1ZJbR5bxBJamswLv1YiIBw&usg=AFQjCNG56KvMvaqO5MVodbm1aX5cRxsJZg&sig2=WyyOB07q51ECwy7lZ_tWrw
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
【マージ】 「合併する」「融合する」といった意味の英単語で、複数のファイルやデータ、
プログラムなどを、決められたルールに従って一つに統合すること。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

なるほど
差分取得=マージという理解でいいのかな(細かく見たら違うでしょうけど)

326 :名無しさん@勉強中 ★ :07/12/09 19:18:39 ID:???
可否はさておき>>322を考えてみますか。
いやー面白いなー。


> ・dat化させたものの最終レスの時間をGMT化してlast-modifiedに格納

http://cn2ch.cn/bbs/test/read.cgi/manhua/1161804392/
を例にとると
最終レス時間はレス64の「2007/11/05 21:11」になるので
何らかの方法でこの文字列を取得して
splitまたは正規表現その他で下記形式に格納
RFC822フォーマット(って何)での日付表示だと
「Fri, 11 May 2007 00:11:21 +0900」となってしまうので
面倒だけど下記

$last_modify = date ("D,d M Y H:i:s", mktime (0,11,21,05,11,2007));

これで$last_modifyには「Fri,11 May 2007 00:11:21」が格納されるので

header("Last-Modified:".$last_modify." GMT");

と付ければLast-Modifiedのヘッダ送信出来上がり
実際試したら出来てます

<?
//2007/11/05 21:11
$last_modify = date ("D,d M Y H:i:s", mktime (0,11,21,05,11,2007));
header("Last-Modified:".$last_modify." GMT");
echo $last_modify;
?>

327 :名無しさん@勉強中 ★ :07/12/09 19:50:17 ID:???


> httpリクエストのIf-Modified-Sinceの時間の項目と比較:
> 項目そのものが無かったらステータス200
> 同じならステータス304
> 違っていたらステータス206

クライアント(カッケー!)からのIf-Modified-Sinceリクエストは
「$_SERVER['HTTP_IF_MODIFIED_SINCE']」で取得出来るみたい
サーバによって出来なかったりするみたいですが。

なので、issetでリクエスト取得可否を調べてからUNIXタイムスタンプに変更。

$if_modified_since = isset($_SERVER['HTTP_IF_MODIFIED_SINCE']) ?
// UNIX タイムスタンプに変換
str2time( stripslashes( $_SERVER['HTTP_IF_MODIFIED_SINCE'])) : false;

これを>>326のUNIXタイムスタンプ化したものと比較して

(1)項目そのものが無かったら

header("HTTP/1.1 200 OK");

(2)変化なしなら

header("HTTP/1.1 304 Not Modified");

(3)タイムスタンプが違っていたら

header("HTTP/1.1 206 Partial Content");


をそれぞれ付けてやれば良さそうです。



参考URL:
PHP で If-Modified-Since に対応してみる -avoidnote-
http://www.avoidnote.com/archives/2005/07/modified_since.php
モジュール版PHPで「If-Modified-Since」に対応する
http://www.arielworks.net/articles/2004/0125a

328 :名無しさん@勉強中 :07/12/09 21:58:02 ID:bZpZAxtN
>> プロキシでhtmlからdatに変換しつつ取得する場合、
>> 「差分取得」は原理的に無理ですよね?

言葉足らずだったかもしれません。
例えばJaneで差分取得する場合、
1:2ch>取得済みのdatのバイト数からRangeでリクエストしdatを取得する
2:したらば>取得済みのdatのスレ数からrawmode.cgiでリクエストしdatを取得する
3:まちBBS>取得済みのdatのスレ数からhtmlを取得しdat変換する

少なくともこれくらいのバリエーションがあるわけです。
基本はもちろん1なので、「差分取得が原理的に無理」ていうのはそういう意味です。
(2,3はURLを判別してのスペシャル処理なので)

で、プロキシでhtmlからdatに変換しつつ取得する場合となると
多分まちBBS方式になるでしょう。
でもそれはBBSの種類により方式が異なる可能性が高いわけで
それを専ブラ作者にいちいち対応してもらえるのも難しいでしょうから
結局プロキシ側で吸収するしかないと思われます。
バリエーションが増えてくると対応するのは大変でしょう。

あと、「差分」を確認するためにはローカルのdatを都度読まないといけないと
思われますがこれも意外に敷居が高いと思います。


> あと実は
> 「マージ」ってよくわかんなかったり。

まあ言葉の意味はどうでもいいんですが実際試してみるといいと思います。
ある程度取得済みのスレにレスポンス206で返すと全部追加される
はずですが、200だと取得済みのレスとの比較を行って新たに追加された
レスだけ追加されると思います。

329 :名無しさん@勉強中 ★ :07/12/10 20:50:42 ID:???
ぐあー余裕が無いー。

>>328
えーと、もしかしたら 前々スレ191-193の
謎の通りすがりさんのように実はとても凄いお方の御降臨なのかもしれず。。
もしそうだとしたら 釈迦に説法 平に平に御容赦頂きたく。
(って 相手によって態度を変えている訳でもないですが)

で、早速ですが

> で、プロキシでhtmlからdatに変換しつつ取得する場合となると
> 多分まちBBS方式になるでしょう。
> でもそれはBBSの種類により方式が異なる可能性が高いわけで
> それを専ブラ作者にいちいち対応してもらえるのも難しいでしょうから
> 結局プロキシ側で吸収するしかないと思われます。

・・・えーと。
もう作ってあるのは判っておられますよね。
>>315でも出しましたが再掲すると

http://mirror.s206.xrea.com/x/htmltodat/?url=http://cn2ch.cn/bbs/test/read.cgi/cn2ch/1172006580/

dat化したこれの元スレは

http://cn2ch.cn/bbs/test/read.cgi/cn2ch/1172006580/

という事なのですが。

で、差分取得云々という事なので調べてたら
レスポンスヘッダのステータスコードやContent-Length等を適切に返せば良さそうなので
phpでそのような事も出来そうだな(>>320)という事だったんですが。


んもー
何でみんな判ってくれないのかなー。
subject.txtは読み込めるけどdat直読み出来ない板(http://cn2ch.cn/)を
専用ブラウザでストレスなく読みたいだけなんだけどなー。
これが文字コードShift_Jisの板なら
htmltodat-convert.wsf(http://www.geocities.jp/mirrorhenkan/jane/htmltodat-convert/
でOKなんだけどなー。
これが文字コードUTF-8なので使えないもんだから
pythonやphpでdat化する方策を模索しただけなんだけど。
で、何とかdat化プロキシが出来たっぽいから
datの位置を(datフォルダ固定でなく)別個設定出来るようにして欲しかっただけの話で。

subject.txtは問題なく読み込めるので
どのスレッドが更新されたかとかはスレッド一覧で問題なくわかるんですよ。
そのスレだけdat化プロキシ経由で取得すれば良いだけの話なんで
差分取得云々は正直どうでもいい。

で、結局何をしたいかというと
現地の方が現地語で「萌え〜☆」とか書いてるのを見てみたいだけなんですが。
例えば下
笑わば笑え

“常萌”有希?
http://cn2ch.cn/bbs/test/read.cgi/COSPLAY/1161396248/

330 :名無しさん@勉強中 ★ :07/12/10 21:01:00 ID:???
ちなみに、phpinfo()を見ると
xreaでは$_SERVER['HTTP_IF_MODIFIED_SINCE']が使えないみたいです。

phpinfo()
http://mirror.s206.xrea.com/x/htmltodat/phpinfo.php

途中にある「last_modified」の項目が0になっていますし
print_r($_SERVER)で環境変数一覧を出力してもlast_modifiedがないみたい。
環境変数を取得出来ないとなると
>>327自体が無意味になってしまうです。

この環境変数を使えるphp可のサーバを探すのも何ですし
とりあえず棚上げですね。
使えれば本当にうまくいきそうなんだけどなー。

331 :名無しさん@勉強中 ★ :07/12/10 21:22:35 ID:???
繰り返しになりますが
単にdatの読み込み先を変えたいだけなんですよ。
勿論、まちBBSのようにhtmlをdat化する機能を内蔵して頂けたら有り難いんですが。
例えば えまのんとかだと htmltodatでいう「read.cgi.7.00?」のhtmlだけですが2CI化してくれるみたい。

proxomitronを使えばリダイレクトとかも出来るんですが
出来ればそのまま読み込めたほうがいいなと。
フィルタを使うとしたら下記
キーボードのCとZを押しながら読み込めばプロキシCGI経由になるです


[HTTP headers]
In = FALSE
Out = TRUE
Key = "URL: Non-dat BBS to ProxyCGI (Out)"
URL = "$KEYCHK(Z)$KEYCHK(X)"
Match = "http://(*)\0/([^/]+)\1/(dat/|kako/\d+/\d+/)(*)\2.(dat|dat\.gz)"
Replace = "$RDIR(http://mirror.s206.xrea.com/x/htmltodat/?url=http://\0/test/read.cgi/\1/\2/)$FILTER(false)"



って
こういう事書いてもわかる方にしかわかんなさそうですし
わかんない方には導入方法とかから伝えるのも前スレ283以降ので私には不適格だと思いましたし
わかる方には 何だその程度の低いショボいフィルタはとか言われそうだし
そういう事を考えると
って何言いたいのだ私は

332 :名無しさん@勉強中 ★ :07/12/10 21:40:10 ID:???


http://pc11.2ch.net/test/read.cgi/software/1195310686/386
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
スレッド一覧で外部コマンドが使えるというのは便利ですよね。
スクリプトにURLを渡してやることで色々と応用が利きそうです。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


ではwshでhtmltodatのようなものを作りますか。
dat変換用の正規表現中で2バイト文字(UTF-8なら3バイト文字か)を使わなければ
どの文字コードでも問題なくdat化出来るみたいですし。

車輪の再々発明になりますが、本家でUTF-8のファイルがdat化出来ないみたいですし
それなりに意味はありそうです。

333 :名無しさん@勉強中 ★ :07/12/10 21:43:42 ID:???
>>331訂正

×キーボードのCとZを押しながら

○キーボードのXとZを押しながら

334 :318=328:07/12/10 23:30:11 ID:yolwaXMk
誤解されておられるかもしれないですが、
貴方のやろうとしてることを否定しているわけでは全然ないですよ。
ただ、自分の経験上、同様のソフトで一番面倒だったのは差分取得の部分だったので
指摘しておきたかっただけで。

> 差分取得云々は正直どうでもいい。
のなら無視してもらっていいです。

335 :名無しさん@勉強中 ★ :07/12/11 02:17:44 ID:???
いえ、別に誤解しているつもりもないです。

ただ、転送量がシビアなものとかなら別ですが
あまり過度のアクセスもなさそうなものの場合
わざわざ難しく考えなくても良さそうな感じがするだけです

経験の浅い者が書いても空疎なだけですが
そもそもdatの差分取得の重要性というのは
read.cgi経由の取得ではCGI・転送量の両方とも負荷が高いので
CGI不可のない静的なdatを 
そして転送量を抑えるために差分取得を という流れで出た話だと思うのですが
一般的に言われている差分取得の意義ってそういう風な理解で良いんですよね。

となると
read.cgiのみ閲覧出来て dat直読み不可の板を閲覧する場合
そういうのってあまり意味がないような気がするのですが。

てか そんなワッショイワッショイと人が集まるようなものだったらまた考え直しますが
そこまでアクセス集中するようなものでもないと思うのです。
浅墓かな。

336 :名無しさん@勉強中 ★ :07/12/11 02:31:53 ID:???
という事で
wshでhtmltodatのようなものを出しとくです

http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat_wsh_0_0_1.zip

試作品という事でsample.htmlをdat化させるだけのスクリプト
案ずるより産むが易しで 思ったより簡単に出来たです。

やたらに時間がかかるです。
いったん丸ごとデータ取得する箇所で時間をとられるみたい。
で、データ取得後のdat化はそう時間はかからない感じです。
この辺 いろいろ改良の余地がありそう。
って 続けるならの話ですが。
反応とかも期待してないですし。

pythonのhtml2datとかだと
何十個ものhtmlをスココンスココンとあっという間にdat化してくれたので
wsh版も同じくらいのスピードと途中経過の可視化が出来たら面白いかなと。

337 :名無しさん@勉強中 ★ :07/12/11 08:24:25 ID:???
ちょっと昨晩の文を読んで反省したです。
有用な助言を頂きながら 何も活かせずに過ぎてしまうのかなと。
そのうち裸の王様になってしまうかも
いやなっているのかも。



>>309で使った
python版html2datも出しておくです

http://www.geocities.jp/mirrorhenkan/python/htmltodat_for_cn2ch.zip

html2dat_UTF8.pyと35個のhtmlファイルが入っているので
pyファイルを実行(ダブルクリック)すれば全部dat化されると思うです

pythonが入っている人しか使えないものなのでwindows環境ではほとんど居ないと思うですが
Mac/Linuxではほぼ標準で入っているそうなので
そのような環境で余裕がある方は試してみて頂きたく。

良かったら結果を教えて頂きたく思うです

338 :名無しさん@勉強中 ★ :07/12/11 17:53:19 ID:???
メモ
WSH@Workshop - WSHのサンプル集&リファレンス
http://wsh.style-mods.net/index.htm

339 :名無しさん@勉強中 ★ :07/12/11 18:06:11 ID:???
>>336
> やたらに時間がかかるです。
> いったん丸ごとデータ取得する箇所で時間をとられるみたい。
> で、データ取得後のdat化はそう時間はかからない感じです。
> この辺 いろいろ改良の余地がありそう。

という事で、色々試してみようかなと思うんですが
wshでのベンチマークテスト(? 意味不明なまま書いちゃったけど^^;)ってどうやるんでしょうか。
データ取得にしても
ReadAll()で丸ごと取得したり
配列に入れたものをjoinで結合取得したり
同じく配列からforの繰り返しで結合取得したりとか色々あるですが
それぞれにかかる時間って どうやって調べればいいんだろか。
ストップウォッチ片手によーいドンでそれぞれ計測するのもいいんですが
やっぱかっこいい事やってみたいですよねー。

340 :名無しさん@勉強中 ★ :07/12/12 12:40:23 ID:???
メモ

お前ら、wsh使ってますか? Part4
http://pc8.2ch.net/test/read.cgi/win/1100489339/887
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
887 名前:名無し~3.EXE[sage] 投稿日:2005/07/13(水) 17:55:23 ID:9mrwEXfu
改行文字って知ってるかい? ってか知らないからこうなんだろうな。
文字列の一行の最後に含まれる仮想的な文字のことなんだけど。
ReadLineは一行の改行直前まで読み取る。つまり改行文字は含まれない。
で、その改行文字を含まない文字列をどんどん足していっちゃったからベタな無改行文字列が出力されたって訳。
改行文字をVBScriptでどう表現するかはこんな感じでぐぐれ。
ttp://www.google.com/search?num=100&hl=ja&c2coff=1&q=VBScript+%E6%94%B9%E8%A1%8C%E6%96%87%E5%AD%97&lr=lang_ja

で、WriteLineは文字列の後ろに改行文字を付加して書き込む。
であるからさ、ReadLineしたのを一々fにため込んだりせずにそのままWriteLineすれば簡単だと思わないか?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

341 :名無しさん@勉強中 ★ :07/12/12 14:54:09 ID:???
あと現状のhtmltodat.wsf(って書いていいのかな・・何か申し訳ないような)だと
ReadAll()でいったん全部取り込んでから改行コードを削除してるですが
この改行削除ルーチン(カッケー!)で
http://www.kanaya440.com/contents/tips/javascript/002.html
を使わせて頂いているです。

で、これをよく見てみるに
−−−−−−−−−−−−−−−−−−−−
for(var i=0; i<myLen.length; i++){
text = escape(myLen.substring(i, i+1));
if(text != "%0D" && text != "%0A"){
newLen += myLen.substring(i, i+1);
}
−−−−−−−−−−−−−−−−−−−−

ループで該当ファイルを一バイト(?)づつ取り出して
それが改行コードかどうか見てるみたい。

という事は、1000レスあるhtmlとかだと
仮に1レス50文字(=100バイト)として
1000レス×100バイト=10万ループしている計算になるですか!!
その前後のhtmlタグを含めたらもっと膨大なループ回数という事に。

ルーチンを使わせて頂いた方には申し訳ない話なんですが
もしかしたらこれが遅くなっている原因の一つなのかも。

342 :名無しさん@勉強中 ★ :07/12/12 19:49:11 ID:???
htmltodat.wsfですが
「ほんとに動いてんのかな 固まってんじゃないだろうな」と自分でも思ったので
経過表示するようにしたです。
これがあると結構ストレスがなくなったりして
でも今日はここまで
ああ余裕がない余裕がない

343 :名無しさん@勉強中 ★ :07/12/13 07:59:28 ID:???
テキストデータを合成するプログラム - 教えて!goo
http://oshiete1.goo.ne.jp/qa2711256.html

344 :名無しさん@勉強中 ★ :07/12/13 21:05:53 ID:???
という事で
htmltodat.wsfのdat化部分は何とか固まったっぽいです

http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat005.zip

変換速度もスココンスココンとまあいい感じ。

ところでやっていて気付いたのですが

これってsample.htmlを本家htmltodatと同じものにしたのですが
最初うまくいったので「よーし次は改行無しのhtmlにしてdat化だ」とやってみたら
全然うまくいかない。

あれこれ考えてやっと判ったのは
本家htmltodatの正規表現「sample」では
本文に該当する箇所で最短一致にしてないのが原因だったみたい。

つまり

m#<DT>([0-9]+).+?(?:<A HREF="mailto:(.+?)">)?<b> (.*?) </b>.*?投稿日: (.*?)<BR><DD>(.*)<BR><BR>#mi

これだと
sample.htmlの改行無しバージョンだと本文が最長一致になってしまうので

m#<DT>([0-9]+).+?(?:<A HREF="mailto:(.+?)">)?<b> (.*?) </b>.*?投稿日: (.*?)<BR><DD>(.*?)<BR><BR>#mi

としてやっとマッチしたと。
ほんと正規表現は奥が深いなあと。

って
私が間違えてsample正規表現を改悪してあった可能性も捨てきれないのですが。

345 :名無しさん@勉強中 ★ :07/12/14 08:19:41 ID:???
さて次は
Web上のhtmlをdat化して
指定フォルダ内への保存ですかね。
ここで留意点なんですが
Web上の文字コードによって
DLする時の方策が違ってくるです
Shift_Jisの場合とUTF-8のそれとでは方法が違っていて
逆の方法でやったら文字化けしてしまうのですが
まあ この辺りは各自で取捨選択して頂くしかないかも
って使う奴おるんかい

でもこれって実は
クラシックOSを使っている者だけの悩みっぽくて
実際はADODB.streamでDLすれば全く無問題なのかも。
BASP21が入っていたらそれを使ってもOKですし。

346 :名無しさん@勉強中 ★ :07/12/14 16:48:05 ID:???
さて
空き時間に頭の体操のつもりでやってみたら
Web上のhtmlをdat化する事が出来たです。
あとはdat化したものの保存先ですが
これもそう難しくなさそう。

作ったものの用途ですが
dat直読みできない板を無理矢理dat化させて
Janeで読めたら嬉しいなあというだけの事で。
まあ私しか使わない事でしょうけど。

副産物として
p2todatやgetlog.wsfのような事も出来そうですが
こっちのほうは 別にいいです

347 :名無しさん@勉強中 ★ :07/12/14 20:37:51 ID:???
http://pc2.2ch.net/test/read.cgi/win/1022248379/635
PC等 [Windows] “お前ら、wsh使ってますか? Part2”
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
635 名前:624 [sage] 投稿日:03/03/02 13:01 ID:ZynoVCOP
しまった、GMT - JST = -9 やん。
そのままでは恥ずいので、www.yahoo.co.jpサーバからGMTを取得するScript

Set xh = WScript.CreateObject("Microsoft.XMLHTTP")
xh.Open "HEAD", "http://www.yahoo.co.jp/", False
xh.send Null
sDate = xh.getResponseHeader("Date")
sDate = Replace(Mid(sDate, 6, 20), " ", "-", 1, 2)
datGreenwich = CDate(sDate)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

348 :名無しさん@勉強中 ★ :07/12/15 10:25:26 ID:???
うーむ
UTF-8のhtml取得って結構厄介だなー。
下のファイルをtest.jsにして実行しても簡体字フォント部分は文字化けしとるです。
保存する文字コードをUTF-8やUTF-8NやUnicodeにしても結果は同じ。


−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
var strUrl = "http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/";

var oXMLHttpRequest = new ActiveXObject("Microsoft.XMLHTTP");
with(oXMLHttpRequest)
{
Open("GET", strUrl, false);
Send();
}
var str=oXMLHttpRequest.responseText;

WScript.echo(str);
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


どこかで読んだですが
UnicodeとUTF-8って別物なんだなーと。


どうしても解決出来なかったら
pythonでやってみますか。
Web上のデータの読み込み部分を追加すれば良さそうなので。

349 :名無しさん@勉強中 ★ :07/12/15 10:48:08 ID:???
と書いたけど
win2000以上とかだと文字化けしないかもですが
何方か試して頂けないかなと

350 :名無しさん@勉強中 ★ :07/12/15 11:26:56 ID:???
HTTP Get -- 各キャラクタセットのWebページの読込み ( IXMLHTTPRequest )
http://winofsql.jp/VA003334/smalltech040206011410.htm
まさか解決策不在なのか? OperaのXMLHttpRequestオブジェクトのresponseTextが文字化けする問題の更なる深み 【▲→川俣晶の縁側→ソフトウェア→技術雑記】
http://mag.autumn.org/Content.modf?id=20051210160430

351 :名無しさん@勉強中 ★ :07/12/15 11:37:51 ID:???
>>348
> どうしても解決出来なかったら
> pythonでやってみますか。

その前に
ADODB.streamを使う奴と
BASP21を使う奴をやってみますか。
自分の環境では後者しか確認出来ないですけど。

352 :名無しさん@勉強中 ★ :07/12/15 12:26:01 ID:???
いやー文字コードよくわかんないや


お前ら、wsh使ってますか? Part4
http://pc8.2ch.net/test/read.cgi/win/1100489339/269,367
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
269 名前:名無し~3.EXE[sage] 投稿日:05/01/14 22:04:18 ID:9FAifjvD

>>266
たしか、ResponseBodyはUTF-16BEになってると思う。



367 名前:名無し~3.EXE[sage] 投稿日:05/02/19 09:06:43 ID:PxBwsUtK
>>366
対象のhtmlファイルの文字コードと、
どう元ファイルを開いてるか、保存ファイルをどう作ってるかのコードを。

UTF16/UTF8なら、OpenTextFileの第4引数に-1、CreateTextFileの第3引数にTrueを入れればいけると思うけど。
//UTF8をUTF8のままで保存してくれるのは良いけど、なんでUTF16用のBOM付きなんだ……? >FileSystemObject
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


上の366さんの書き込みも面白いです

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
366 名前:名無し~3.EXE[sage] 投稿日:05/02/19 05:26:30 ID:5E0bL9lX
中国語のHTMLテキストを整形しているのですが、ReadLineやReadAllを使うと一部の中国語が勝手に変換されてしまいます。
どのような対策が考えられるでしょうか?

370 名前:366[sage] 投稿日:05/02/21 03:19:16 ID:y0/zN+N5
コード = gb2312

例えば、
ttp://www.eg365.com/disp.asp?boardid=12&typeid=237
をIEからファイル保存して、Q237.HTMという名前を付ける。

以下VBS。

IN_FNAME = "Q237.HTM"
set FS = CreateObject("Scripting.FileSystemObject")
set in_file = FS.GetFile(IN_FNAME)
set in_text_file = in_file.OpenAsTextStream(1) ''' 1 = for read
str = in_text_file.ReadAll
in_text_file.Close

OUT_FNAME = "Q237X.HTM"
FS.CreateTextFile OUT_FNAME
set out_file = FS.GetFile(OUT_FNAME)
set out_text_file = out_file.OpenAsTextStream(2) ''' 2 = for write
out_text_file.Write(str)
out_text_file.Close

VBSおわり。

"FC Q237.HTM Q237X.HTM"などすると違っている。(Windows98)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

353 :名無しさん@勉強中 ★ :07/12/15 12:39:51 ID:???
あ、出来たです。

>>352
> UTF16/UTF8なら、OpenTextFileの第4引数に-1、CreateTextFileの第3引数にTrueを入れればいけると思うけど

これやったらOKになったですよ。
チュートリアル見てもよくわかんないんですけど。

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
var strUrl = "http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/";

var oXMLHttpRequest = new ActiveXObject("Microsoft.XMLHTTP");
with(oXMLHttpRequest)
{
Open("GET", strUrl, false, -1);
Send();
}
var str=oXMLHttpRequest.responseText;

WScript.echo(str);

var moto = "testsample.html";

fs = WScript.CreateObject("Scripting.FileSystemObject");
abc = fs.OpenTextFile(moto, 2, true, -1);//2=ForWriting, true=create
abc.Write(oXMLHttpRequest.responseText);//改行コード入らない
abc.Close();
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


結果表示のポップアップでは文字化けしてるですが
生成したtestsample.htmlでは直ってるみたい。

354 :名無しさん@勉強中 ★ :07/12/15 13:32:41 ID:???
よっしゃ
では対象htmlがShift_JisとUTF-8の場合の分岐処理をすればいいのかな。

URLや保存先は
WScript.Arguments()で取り出せば良さそうです

355 :名無しさん@勉強中 ★ :07/12/15 16:35:50 ID:???
うむむ

上手くいったぜベイビーと思ってJaneNida該当フォルダに入れてみたら
「ここ壊れてます」ばかりで
生成したdatの文字コードを見たら
UTF-8ではなくUnicode(って何よ)になってるのが原因みたい。
datの文字コードをUTF-8に変換したら読み込めたです。

文字コードをUnicodeからUTF-8にして保存するにはどうすりゃいいんだ
ぐああ

356 :名無しさん@勉強中 ★ :07/12/15 18:23:29 ID:???
えーと

つまり>>353で生成されたhtmlの文字コードが
UTF-8ではなく
Unicodeなのがネックのようで。

どうしても駄目なら
御返事はあまり期待せず
偉い人に伺ってみるしかないかな

357 :名無しさん@勉強中 ★ :07/12/15 19:46:25 ID:???
仕方ないので目先を変えて
pythonでやってみますか。

とりあえず>>279のスクリプトで
http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/
を取得してみると
文字化けもせずUTF-8だったので
これを>>337のhtml2datに追加してみようかなと。
見よう見真似で何とかなりそう。

ただ問題は、これをJaneNidaで使う場合
getlog.wsfのような保存先フォルダ自動指定が出来ないのです

だってpython全然わかんないんだもん
ごめんなさいごめんなさい

358 :名無しさん@勉強中 ★ :07/12/16 13:28:04 ID:???
>>351
> ADODB.streamを使う奴と
> BASP21を使う奴をやってみますか

まず前者
下のをtestADODB.vbsとでもして保存

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

sSource = "http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/" 'ダウンロード元
sDest = "testsample.html" 'コピー先

test = GetHTMLDocumentADODB(sSource, sDest)

Function GetHTMLDocumentADODB(sSourcr, sDest)
Set oHTTP = WScript.CreateObject("microsoft.xmlhttp")
oHTTP.Open "GET", sSource, False
oHTTP.Send

Set Stream = WScript.CreateObject("Adodb.Stream")
Const adTypeBinary = 1
Const adSaveCreateNotExist = 1
Const adSaveCreateOverWrite = 2
Stream.Type = adTypeBinary
Stream.Open
Stream.Write oHTTP.responseBody
Stream.Savetofile sDest, adSaveCreateOverWrite
End Function
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

これを実行して
同じフォルダにtestsample.htmlが出来ていたらいいなと。
自分の環境では試せないので何方か試して頂きたく。

これって>>52のスクリプトを手直ししただけなので
バイナリモードで取得するようになってますが
取得出来たらいいじゃないか(出来なかったら残念だけど)

359 :名無しさん@勉強中 ★ :07/12/16 13:34:29 ID:???

BASP21を使う場合

testBASP21.vbs
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
test = GetHTMLDocumentBASP21("http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/", "testsample.html")

Function GetHTMLDocumentBASP21(sURL, sFileName)
Set Fs = WScript.CreateObject("Scripting.FileSystemObject")
Set bobj = WScript.CreateObject("basp21")
sRoot=Fs.BuildPath(Fs.GetParentFolderName(WScript.ScriptFullName),"\") 'スクリプトのあるフォルダ
WScript.echo sRoot & sFileName
'hozontest = sRoot & sFileName

'rc = bobj.W3get("-d " & sRoot & " " & sURL)
rc = bobj.W3get("-d " & sRoot & " -o " & sFileName & " " & sURL)
End Function
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

BASP21は下からDL出来るです
1.44メガあるですがアンインストールも出来るので安心安心

http://www.hi-ho.ne.jp/babaq/basp21.html


どうしてもUTF-8のhtmlをローカル保存出来なかったら
これを使うしかないのかも。

でも、ふと思ったんですが
外国の方々も当然wshを使ってると思うですが
こういう場合 みんなどうしてるんでしょうか。
babaqさんがお作りになられたBASP21やBregexp.dllだって
日本ローカルのものでしょうし。

360 :名無しさん@勉強中 ★ :07/12/16 13:37:09 ID:???
>>358のコード スペルミス

×Function GetHTMLDocumentADODB(sSourcr, sDest)

○Function GetHTMLDocumentADODB(sSource, sDest)

だって自分で試せないんだもの
だもんでまだあるかも

361 :名無しさん@勉強中 ★ :07/12/16 14:43:25 ID:???
>>359補足(言い訳)

> babaqさんがお作りになられたBASP21やBregexp.dllだって
> 日本ローカルのものでしょうし

これ別に他意や含意は全く無くて
勿論外国の方々で使っておられる方も居るとは思いますが
例えばBregecp.dllはShift_Jisでしか使えないという制約が未だにある訳で
もしUTF-8やUnicodeやBig5やgb2312でも使えたら
私が 無い頭をうんうん唸らせる事もないのですが。

鬼車のUnicode対応版も出ていますが
自分では何も出来ないですし。

K.Takata's software : bregonig.dll
http://homepage3.nifty.com/k-takata/mysoft/bregonig.html


例えば下のhtmlは文字コードBig5ですが
正規表現を考えればそれなりにdat化出来ると思うです

建議改用UTF-8編碼取代Big5編碼
http://web.archive.org/web/20050113190336/www.comic.com.tw/mini02/test/read.cgi/operate/1078772150/l25

362 :名無しさん@勉強中 ★ :07/12/16 15:02:33 ID:???
と書いたけど
英語版もあるという事は
何とかなるのかな>Bregexp.dll

BREGEXP.DLL
http://www.hi-ho.ne.jp/babaq/eng/bregexp.html

363 :名無しさん@勉強中 ★ :07/12/16 20:21:46 ID:???
文字列を UTF-8 に変換
http://www.geocities.co.jp/SilkRoad/4511/vb/utf8.htm

参考になるかな
なったらいいな

JavaScriptでファイルの書き込みをUTF-8で行う(htaまたは、wsh用) - jiroの日記
http://d.hatena.ne.jp/sukesam/20070922/1190400851

364 :名無しさん@勉強中 ★ :07/12/16 20:47:13 ID:???
うむむ
BASP21のWgetでUTF-8のhtmlを取得するようにしたら
それを読み出して変換保存する箇所も変えなければいけないみたい
いやー面白いなー
文字コードって愉快だなー
あはは

365 :名無しさん@勉強中 ★ :07/12/17 18:47:01 ID:???
ちょうどBASP21に文字コード変換する命令があって
UnicodeからUTF-8に変換出来たです
より詳しく書くと
「UNICODE UCS2」から「UNICODE UTF8」への変換ですが。

簡単に変換スクリプトを書くと
仮に
文字コードUnicodeのtestsample.htmlを
文字コードUTF-8のtestsample1.htmlに保存するなら

testKconv.vbs
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Set bobj = WScript.CreateObject("basp21")
test = bobj.KconvFile("testsample.html","testsample1.html",5,4) ' UNICODE からUTF-8に変換
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

この2行だけで済んでしまうです
何て楽なんだ

という訳で
wsh標準機能のみでの変換はひとまず棚上げにして
これで一息つこうかなと。

366 :名無しさん@勉強中 ★ :07/12/17 18:54:44 ID:???
それにしても
Bregexp.dllがShift_Jis以外ではうまくいかないからって色々やって
結局babaqさんがお作りになられたBASP21を使うっていうのは
お釈迦様の手の掌から一歩も出られなかった孫悟空みたいなもんですかね。
でもまだ他に手はあるかもと思いはしますが。


次なんですが
ADODB.streamでUnicode→ UTF-8変換するような方策はないものかなと。
これがあればwsh標準の機能だけで出来るようになるので。
(ただ私は確認も何も出来ないので・・・ってもういいか)

367 :名無しさん@勉強中 ★ :07/12/17 20:13:10 ID:???
ADODB.streamの文字コード変換って
検索すると実にわんさかあるですね。
ありすぎてよくわかんない


それはそうと
これ↓もしかして使えないかな。

Unicode ⇔ UTF-8 by AOK
http://homepage3.nifty.com/aokura/jscript/utf8.html

368 :名無しさん@勉強中 ★ :07/12/18 07:40:18 ID:???
http://tmp7.2ch.net/test/read.cgi/download/1190839251/363

htmltodat.wsfでも出来ますが
wshでの変換はCやDelphiのと比べて格段に遅いでしょうし
わざわざ作って「おせーぞばか」とか言われても割に合わないし
ただでさえあちこち迷惑しまくり千代子なのにまた負荷をかけるのも何だし
やめとこかな
公開しても後悔するだけだろなと

てか現状でも
htmltodat-convert.wsfで何とかなるんじゃないかなと

369 :名無しさん@勉強中 ★ :07/12/18 07:57:37 ID:???
中日翻訳(簡体字)=$CHOTTO http://www.excite.co.jp/world/chinese/?before=$TEXTIU&wb_lp=CHJA&big5=no&start=%E7%BF%BB+%E8%A8%B3&after=

これで中国2chのわかんないとこを外部コマンド翻訳して読んでるです
にしても 台湾の掲示板と違って ほとんど日本語出てこない感じですね。
「毒男板」「御宅族」とかは明らかに日本語由来でしょうけど
ってcn2chの存在自体が日本由来でしょうけど。

「有閑倶楽部板」って
今オンエア中のドラマの板なのかな
どうやって見てるんだろ
ジャニーズの画像(ですよね)が結構あるですが
日本じゃないから大丈夫なのかな

370 :名無しさん@勉強中 ★ :07/12/18 08:06:26 ID:???
VBScriptで文字コード変換 [Design For Life]
http://www.inaba.vc/item/5
[WSH] - Fioの素敵な日々
http://d.hatena.ne.jp/Fio/searchdiary?of=5&word=*%5BWSH%5D

371 :名無しさん@勉強中 ★ :07/12/18 19:44:56 ID:???
メモ

2ちゃんねる等可視化計画
http://v2ch.media.t-kougei.ac.jp/v2ch.php?r=XfW96eYtDjTL9CD6

これ
http://money6.2ch.net/test/read.cgi/haken/1197438526/
がdat落ちした後も閲覧可能だったら
どんなにか嬉しい事でしょうか。

372 :名無しさん@勉強中 ★ :07/12/18 19:51:12 ID:???
詳細あったです

Vis2ch - MediaArtWiki
http://wiki.media.t-kougei.ac.jp/index.php/Vis2ch
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
本文のキャッシュは元DATが倉庫入りした後もローカルに7日間だけ保持される。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

373 :名無しさん@勉強中 ★ :07/12/18 20:13:35 ID:???
さて
BASP21でUnicode→UTF-8変換出来たので
今度はADODB.streamでのUnicode→UTF-8変換ですか。
自分には未知の分野なのでどうしたものか。

とりあえずコードを出しとくです

http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat006.wsf.txt

上のをダウンロードしてhtmltodat006,wsfにリネームして実行してみて下さい。
cn2chのスレッドがdat化されると思うです。

具体的に書くと
testsample.htmlとsample.datの2ファイルが生成されます。
前者はcn2chのhtmlそのもので
後者はそれをdat化したもの。

ただ、問題は
これらの文字コードがUTF-8ではなくUnicodeな点で。
ちなみにUTF-8だとdat化の際 正規表現が全然ヒットしないので
Unicodeのままdat化した訳で。

私が手を出せない箇所は
253-261行にある
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
if(Uni2UTF8=="0"){
WScript.echo("文字コードShift_Jis");//何もしない
}else if(Uni2UTF8=="1"){
//ADODB.streamでUnicode→UTF-8変換
WScript.echo("ADODB.streamでUnicode→UTF-8変換");
}else if(Uni2UTF8=="2"){
WScript.echo("BASP21でUnicode→UTF-8変換");
BASP21ConvUni2UTF8(moto);//BASP21でUnicode→UTF-8変換
}
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

この
> //ADODB.streamでUnicode→UTF-8変換
の箇所で。

文字コードUnicodeのdatファイル「moto」をUTF-8に変換したいのですが
ADODB.streamでどのようなコードを書けばよいのか全然わからんのです。
自分のマシンで使えるのなら試行錯誤のしようもあるのですが。


反応があったら
おら 舞い上がっちまうで
ほんま

374 :名無しさん@勉強中 ★ :07/12/19 17:48:28 ID:???
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
たる さん 2001年 10月 19日 23時 46分 46秒


To:らしゅ さん

SJISのテキストを上書きしてEUCに変換します。
IE5.0以上必須です。

未検証ですがUCS2でも少し変えれば出来るかなぁと思います。
あれ?utf-8でしたっけ(←あいまいな奴)
本当は文字列をベタでノードにするより、createCDATASectionメソッドでノードにした方が
< > & 辺りの制限が無くて良いんですが(それでもまだ]]>という制限はあるけど)
他にも何か改良の余地がありそうなのでそこら辺も含め後でと言うことにして。
文字列の切り落としがあまりうまくないです。何かいい方法があったら教えてください〜(逃げ)
↑こんなこと仕事じゃ…やらない…はず。(汗)

Option Explicit
Const csFile = "./fileStock/dataText.txt"
Dim objFS, objTS, sRead, sXML,objXML

Set objFS = CreateObject("Scripting.FileSystemObject")
Set objTS = objFS.OpenTextFile(csFile,1)
sRead = objTS.ReadAll
objTS.Close
Set objXML = CreateObject("Microsoft.XMLDom")
objXML.async = False
sXML="<root>" & vbCrLf & _

sRead & vbCrLf & _
"</root>"

objXML.loadXML(sXML)
objXML.insertBefore objXML.createProcessingInstruction("xml","version=""1.0"" encoding=""euc-jp"""), objXML.documentElement
objXML.save("./fileStock/dataText.xml")
Set objTS = objFS.OpenTextFile("./fileStock/dataText.xml",1)
objTS.Skip(49)
sRead = objTS.ReadAll
objTS.Close
objFS.DeleteFile("./fileStock/dataText.xml")
sRead = Left(sRead,Len(sRead)-11) 'あれ?EUCって漢字3バイトだっけ?
Set objTS = objFS.CreateTextFile(csFile, True, False) '同じ名前にする事で上書きします
objTS.Write sRead
objTS.Close
Set objXML = Nothing
Set objFS = Nothing
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

375 :名無しさん@勉強中 ★ :07/12/19 17:49:14 ID:???
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
つちや さん 2002年 09月 22日 14時 04分 20秒


唐突ですが、
UTF-8のテキストファイルを、Shift-JISに変換するサンプルです。
Microsoft ActiveX Data Object (ver2.5以上)が必要です。
なお、指定可能な文字コードは、ISO-2022-JP、EUC-JP、UNICODE、UTF-7など。
MSXMLのXMLHTTPを使う場合は、Srcストリームの方に修正が必要ですが、
結構手軽で応用範囲が広いかも。
(改行コードの指定が必要な場合はLineSeparatorを使います)


Const adTypeText = 2
Const adSaveCreateOverWrite = 2



Set Src = CreateObject("ADODB.Stream")
Src.Open
Src.Type = adTypeText
Src.Charset = "UTF-8"
Src.LoadFromFile "C:\UTF8.txt"



Set Dst = CreateObject("ADODB.Stream")
Dst.Open
Dst.Type = adTypeText
Dst.Charset = "Shift_JIS"
Src.CopyTo Dst
Src.Close

Dst.SaveToFile "C:\SJIS.txt", adSaveCreateOverWrite
Dst.Close

Set Src = Nothing
Set Dst = Nothing

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

376 :名無しさん@勉強中 ★ :07/12/19 21:13:51 ID:???
>>374のスクリプト
一時保存のxmlファイルはちゃんとEUC=jpやUTF-8になってますね。
でも読み込み元ファイルがUNICODEだとスクリプトエラーになってしまう・・・

377 :名無しさん@勉強中 ★ :07/12/20 19:55:11 ID:???
三流君VBA:IE 操作 .ExecWB でコマンド実行(検索したかったけど)
http://www.ken3.org/vba/backno/vba112.html

378 :名無しさん@勉強中 ★ :07/12/21 07:55:52 ID:???
あー
IEのExecWBでOLECMDID_SAVEを使えば何とかなるっぽいですが
サンプルスクリプトを理解して
そこから該当個所をコピペするってえのは大変だー
だがそこがいい(マゾ)(マジ?)

379 :名無しさん@勉強中 ★ :07/12/21 18:00:57 ID:???
よし
ExecWBを使って
Unicode→UTF-8変換出来たぞ
何とかADODB.streamを使わずに済んだかも

IE5.5以上必須になったですが
IEが入ってないWindowsってすっげーレアケースだと思うので
まあいいかなと。


あとはこれをプロシージャ化してhtmltodat.wsfに組み込んで
テストランしたものをJaneNida該当フォルダに入れて調べてみて
文字化けその他もなくてOKっぽかったら
WScript.Arguments()のデータ渡しの辺りと
該当フォルダ指定の箇所に取りかかるだな
いやー面白い

380 :名無しさん@勉強中 ★ :07/12/21 19:45:29 ID:???
メモ

2000年 02月 25日 02時 38分 30秒

381 :名無しさん@勉強中 ★ :07/12/22 16:34:11 ID:???
よっしゃ
htmltodat.wsfに組み込んでdat化UTF-8化したものを
JaneNida該当フォルダに入れて読んでみたですが
文字化けしてないようだ

382 :名無しさん@勉強中 ★ :07/12/22 17:55:40 ID:???
ついでに
htmltodat.phpでdat化したもの(通常こっちを使ってますが)と比べると

php版でdat化したものをエディタで開くと文字化けしたですが
調べてみるとこちらのほうはUTF-8である事のヘッダ目印(BOM)が付いてないのが原因みたい。
wsh版のほうはというと、スクリプト作者様がちゃんと付けるようにしてあったので
文字化けしなかったでした
いやーすごい

383 :名無しさん@勉強中 ★ :07/12/22 19:02:20 ID:???
お前ら、wsh使ってますか? Part2
http://pc2.2ch.net/test/read.cgi/win/1022248379/728-730n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
728 名前:名無し~3.EXE[] 投稿日:03/03/24 01:56 ID:ZmE7iov5
WSHにはDOSの
・ファイル結合
copy /b a.txt+b.txt c.txt

・リネーム
ren a.txt b.txt

に当たる処理を容易に行える命令はないの?


729 名前:名無し~3.EXE[sage] 投稿日:03/03/24 03:46 ID:zcvTmdSc
Dim WSH
Set WSH = CreateObject("WScript.Shell")

WSH.Run "cmd /c copy /b a.txt+b.txt c.txt",1,True
WSH.Run "cmd /k ren a.txt b.txt",1,True


730 名前:名無しさん募集中。。[sage] 投稿日:03/03/24 04:34 ID:MV8cQtQK

>728
そこら辺の(内部、外部問わず)コマンドアプリとして用意されている物は、無理にWSHでやる必要ないんじゃないのかな。
それらをWSH標準で用意されているコマンドで行うには各々3〜4行は必要だよ。

>729
Runメソッドの第2引数を0にすると裏でやっている感じでいいかもね。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

384 :名無しさん@勉強中 ★ :07/12/23 10:04:46 ID:???
上のリネーム
何だかうまくいかない・・・




メモ
htmltodat.pyで使えるかなと

pythonでHTML解析 - 清水川Web
http://www.freia.jp/taka/blog/169

385 :名無しさん@勉強中 ★ :07/12/23 14:03:01 ID:???
別の方法で何とかなったです


'http://q.hatena.ne.jp/1166525285
Function riname(before, after)
Set Fs = WScript.CreateObject("Scripting.FileSystemObject")
Set f = Fs.getFile(before)
f.name = Fs.getFileName(after)
End Function


で、何でこんな事したいかというと
ExecWBで文字コード変換する場合
IEの拡張子設定に左右されるみたいで
拡張子がdatのままではエラーが出るからで。
なるべく標準機能だけで何とかしたいですし。

386 :名無しさん@勉強中 ★ :07/12/23 16:32:29 ID:???
よしこれ↑も組み込めた
あとは外部コマンド用にURL取得と保存先フォルダ指定かな

変換結果式並べ替えと前処理・後処理はどうしようか。
必要性を感じたらつけるかな。
どうせ自分しか使わないんだし

387 :名無しさん@勉強中 ★ :07/12/23 17:26:48 ID:???
ところで少し悩みが。

datキーなのですが
URLを解析(カッケー!)して9桁or10桁の数字があったらそれをdatキーにしてみたのですが
例えば>>361で出したwebarchiveのURLとかだと

http://web.archive.org/web/20050113190336/www.comic.com.tw/mini02/test/read.cgi/operate/1078772150/l25

はじめのほうの「20050113190336」に先にマッチしそうです。
どうすればいいのだろう。

現状は下のようにしてますが(test1にURLが入るです)

if(test1.match(/.*?(\d{9,10}).*?/i)){
var datkey = RegExp.$1;
}else{
var datkey = "sample";
}

泥臭くなりますが

if(test1.match(/.*?(9\d{8}|1\d{9}).*?/i)){

としたほうがまだマシなのかな。
9桁の場合、先頭数字が9
10桁の場合、先頭数字が1
という事になるですが。

388 :名無しさん@勉強中 ★ :07/12/23 20:16:52 ID:???
うーむ
保存先フォルダ指定との絡みもあるのだなぁ>datキー取得

389 :名無しさん@勉強中 ★ :07/12/23 20:41:20 ID:???
これまでの途中経過

http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat001.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat002.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat003.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat004.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat005.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat006.wsf.txt
http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat007.wsf.txt

バックアップという事で。
これでローカルのファイルをお掃除出来るです

390 :名無しさん@勉強中 ★ :07/12/23 22:23:56 ID:???
おお
そういえばhtmltodat-convert.wsfでも保存先を指定してたっけだ
これのコードをコピペすれば良かったっけだなー
よしクリスマスに片付けてしまおうか

391 :名無しさん@勉強中 ★ :07/12/24 08:55:44 ID:???
と書くとプレッシャーがかかるので
前言撤回

392 :名無しさん@勉強中 ★ :07/12/24 11:46:40 ID:???
>>245の2ch-imodeのhtmlですが
タイトルに付くものが「2ch-imode」から「2ch-i」に変更されたみたいですね。
前処理部分を下記に変更すれば良さそう

s#(<title.*?): 2ch-imode(</title>)#$1$2#k
 ↓
s#(<title.*?): 2ch-i(</title>)#$1$2#k


最近 2ch-imodeの管理人さん
更新が立て続けですね。
「IPv6対応」とか 検索してもよくわかんない

393 :名無しさん@勉強中 ★ :07/12/24 18:34:38 ID:???
よし
htmltodat.wsfが出来たっぽい。


ただ、経路的問題なのか何なのかわかんないですが
cn2chが私のホストからだととても重いです。
htmltodat.phpだとスムーズだったので
試しにアメリカのプロキシ経由でやってみたらうまくいったのですが。

394 :名無しさん@勉強中 ★ :07/12/25 17:52:25 ID:???
メモ

独身男が毒づくスレ
http://cn2ch.cn/bbs/file/1159788900.html

上記dat化
正規表現
m#<DT><A.*?>([0-9]+).+?<B>(?:<A HREF='mailto:(.+?)'>)?(.*?)(?:</A>)?</B>.*?:(.*?)<DD>(.*?)<BR><BR>#mi

395 :名無しさん@勉強中 ★ :07/12/25 18:05:30 ID:???
上の正規表現を
htmltodat007.wsf中のそれと差し替えてdat化させたもの(あっという間に出来たです)を
JaneNida該当フォルダに入れて読んでるんですが
日本語なのは見事にタイトルだけですね。
台湾の掲示板とかだと日本語も結構出てたりするんですが。
ビバ外部コマンド

こういう、何というか
外部向けでない内輪向けの生の声って面白いですね。
台湾や韓国の方々とはまた雰囲気が全然違うですし。

396 :名無しさん@勉強中 ★ :07/12/25 19:27:10 ID:???
todoメモ

・変換結果式並べ替え対応
・ドラッグ&ドロップ対応
・フォルダ内一括変換対応
・正規表現各自入力対応(だってソースいちいち見て変えるの面倒なんだもん)
・前処理・後処理対応(「この箇所に各自で入れて下さい」の場所を設ける)

こんなもんですか。
これらは何とか出来そうです。
必要性を感じたらですが。


あと個人的に切実に欲しいのが
文字コードBig-5やgb2312やEuc-krのhtml対応なんですが
今の自分にはwshでは無理っぽい。
phpでもよくわかんない。
pythonのほうで模索してみるかなと。
現地の方でこういう事やってる解説サイトがあったら一発なんですが
まあ適当にやってみますか。


いやー
独り遊びってほんとに楽しいもんですね。

397 :名無しさん@勉強中 ★ :07/12/26 08:02:46 ID:???
JaneNida外部コマンド組み込み用のhtmltodat.wsfを出しとくです

http://www.geocities.jp/mirrorhenkan/wsh/htmltodat/htmltodat008.wsf.txt

DLしたhtmltodat008.wsf.txtを拡張子wsfにリネームしてJane2ch.exeと同じフォルダに入れ
外部コマンド登録は下記

htmltodat008=wscript "$BASEPATHhtmltodat008.wsf" "$LINK"

外部板として例えば
http://cn2ch.cn/bbs/tongren/
を適当な板名で登録して
birdconf.iniにUTF-8である旨登録して
例えば下記スレッドを右クリックからコマンド呼び出ししてみて下さい
dat化されて該当フォルダに保存されて、読み込めるようになると思うです

中国語読めない><
http://cn2ch.cn/bbs/test/read.cgi/tongren/1195601732/


この呼び出しがタイトル一覧から出来れば嬉しいなと。
つまりタイトル一覧で外部コマンド呼び出し出来たら有り難いと思うです。
そうすれば

htmltodat008=wscript "$BASEPATHhtmltodat008.wsf" "$URL"

と登録し直して
タイトル右クリックでdat化取得とか出来ると思いますので。





・・・要望の下書きのつもりはなかったんですが
これをもとに要望してみますか。
だとしたらあと2〜3点あるですが。

398 :名無しさん@勉強中 ★ :07/12/26 21:54:59 ID:???
書いたです

http://pc11.2ch.net/test/read.cgi/software/1195310686/552-553n

打たれ弱いので
煽られたらへこむです

399 :名無しさん@勉強中 ★ :07/12/28 13:08:16 ID:???
メモ

用WSH 想ASP 一???数据?
http://www.pcdog.com/edu/asp/27/11/d267812.html

文字コードgb2312のファイルをwshで使いたいのですが
参考になったらいいなと。


あとここ

jisaku
http://ha1.seikyou.ne.jp/home/akairingosaita/hangul/jisaku.htm

400 :名無しさん@勉強中 ★ :07/12/28 18:38:14 ID:???
ときどきの雑記帖 リターンズ 2007年1月
http://www.kt.rim.or.jp/~kbk/zakkicho/07/zakkicho0701.html
The Past Times
http://lyrics.meicho.com.tw/modify.htm

401 :名無しさん@勉強中 ★ :07/12/28 19:09:42 ID:???
上の「ときどきの雑記帖」さんの所、すごく面白いですね。

で、そこ経由

旗旗 - ブログ「旗旗」 : 日本語CGIを韓国語で動かす by 草加耕助
http://bund.jp/modules/wordpress/index.php?p=326

402 :名無しさん@勉強中 ★ :07/12/28 20:12:18 ID:???
WEB開發 | HTML | XML | VBScript | JavaScript | CGI/perl | ASP | PHP | JSP | ASP.NET | DreamWeaver
http://big5.chinaz.com:88/book.chinaz.com/others/web/web/index.htm

403 :名無しさん@勉強中 ★ :07/12/28 21:51:10 ID:???
さて
文字コードbig5やgb2312のサイトを
そのまんま取得する方法がわかんない・・・。
ADODB.streamを使ってResponse.bodyをcharset指定して読み込めばいいっぽいんですが
(って間違ってるかも^^;)
私のマシンでは敵わぬ夢なので。

タグ崩れるの承知で
IE経由でDLしてみるかな。

404 :名無しさん@勉強中 ★ :07/12/29 20:39:52 ID:???
メモ
http://www.megabbs.com/
のsubject.txtとdatファイルについて



http://www.megabbs.com/mac/

subject.txt(に該当するもの)
http://www.megabbs.com/mac/mac_newb.txt

dat(に該当するもの)
http://www.megabbs.com/mac/txt/mac_1008509845a.txt
http://www.megabbs.com/mac/txt/mac_1008509845b.txt

dat一覧リスト表示
http://www.megabbs.com/mac/txt/

405 :名無しさん@勉強中 ★ :07/12/30 13:07:10 ID:???
ついさっき
ホットゾヌ2をDLして
proxomitron経由で
http://www.ichigobbs.net/
の板一覧取得とスレッド一覧およびスレッド取得してみたですが
どうもhtmlを取得してそれをsubject.txt化したりdat化したりされてるみたいですね。


で、メモ
ichigoBBSのdat化

スレッド例
http://www.ichigobbs.net/cgi/15bbs/2ch/0115/

正規表現
m#<DT>([0-9]+): *?<font.+?><b>(?:<a href="mailto:(.*?)">)?(?:<font.+?>)?(.*?)(?:</font></a>)?</B></font>(?:  )(.*?)<DD>(.*?)(<br> <dt>)#mik

前処理
s#<a rel.+?>(.+?)</a>#$1#igk


これでdat化出来ますが
例えばレス136等は透明消去されているみたいです。
元のhtmlの段階からしてレス番不在で。

http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/498-499n
の機能追加が欲しいなと思うんですが。

406 :名無しさん@勉強中 ★ :07/12/30 15:22:22 ID:???
メモ
remix2ch(http://contents-factory.net/remix2ch/)のdat化について

URL例
http://contents-factory.net/remix2ch/read.php?url=http://live23.2ch.net/test/read.cgi/liventv/1176376861/

正規表現
m#<dt>([0-9]+) :<span class="name">(?:.+?"mailto:(.+?)"><b>)?(.+?) ?(?:</b></a>)?</span>:(.*?)\(スコア.+?<dd> ?(.*?)<br></dd><hr>(<dt>|</dl>|<script)#mik

前処理
s#(<title>.+?) - remix2ch(</title>)#$1$2#

受信オプション→HTTPヘッダ
Cookie: preview_limit=zero; design=2ch; normal_view=on


これでいけるかと思います。
クッキー送信が必要な所なので注意して下さい

407 :名無しさん@勉強中 ★ :07/12/30 15:34:31 ID:???
で、ついでなんですが
このスレッド snapshotにも1001まで残っていますね。
後で直しておきますか。

http://ss.chbox.jp/dat.php?url=http://live23.2ch.net/test/read.cgi/liventv/1176376861/


chbox.jpのサーバですが
むむむさんのページのサーバ一覧を見てみると(って今URL探すの面倒ですが)
讃岐メニューさんや公式p2さんのように
運営の方から貸与されたものみたいです。
だもんでp2todatとかが出てもそうレスポンスが重くならないみたいで。
いや自分を棚にあげてる訳じゃなくて わざわざ書くのも何ですし。

外部コマンドで23ch.infoさんのログを取得するhtmltodat.wsfもやってみたら簡単に出来たですが
これ以上あちこちに負担をかけるのも何なので
自分 出すのはやめとくです
p2todatの作者さんはどうされるのか判りませんが。

408 :名無しさん@勉強中 ★ :07/12/30 17:55:41 ID:???
ホットゾヌですが
メガBBSのほうもhtml経由でdat化subject化されてるみたい。

なるほど、こりゃ安易に
「メガビ対応まだー(後略)」「苺対応(後」
というような要望に
皆反応しない訳だなと。

メガBBSはよう知らんですが
苺BBSのほうは経済板とかたまに覗いたっけだなー
すげーレベルたけーと思ったでしたっけでした
ドラエモンさんとかまだ居られるのかなとか。

409 :名無しさん@勉強中 ★ :07/12/30 20:28:00 ID:???
>>406-407
done(カッケー!)

今年も至らないながら色々遊んだっけだなー
ここで出してリンクさせてないやつとか結構あるですが
気が向いたら何とかしますか
まあ自己満足だし別にどうでもいいや
自己満足といえば
>>407で作ったついでに
23ch.infoさんのログをかちゅdatとかちゅidxに取得変換する
htmltokatjudat.wsfも出来たっぽいですが
また出してこじれてもイヤなのでやめとくです

にしても
年々きつくなってくるなー

410 :名無しさん@勉強中 ★ :08/01/01 11:33:44 ID:???
新年おめでとうございます

苺BBSをJaneNidaで読めるように出来ないか画策中。
変換してdat格納&読み込みは>>409のものの流用で簡単に出来たですが
>>405の欠番補完にまだ手をつけとらんです。
もひとつパラメータを追加して
ループ中でレス番(htmltodat.wsfだと$i)との数値比較をして
その差が1より大きかったらその数だけあぼーん行を追加するループをつければ何とかなりそう。
それほど面倒な作業でもなさそうです(そう思わなきゃやっとれん)

問題はsubject.txt生成で
>>404のメガBBSのようなURLが該当しなさそう。
ホットゾヌ2の場合は例えば
http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy&page=0
からsubject.txt化されてるみたいなんですが
自分でやるとなると次ページ次ページと順繰りにアクセスしてマージしないといかんですし
そうやってsubject.txt化するのも時間がかかりそう。

ここはタイトル取得を諦めて
http://www.ichigobbs.net/economy/economy_new.txt
からsubject.txt生成してみるかな。
でもタイトルが無いというのはやはりなと思うですし
subject.txt都度書き換えで消えてしまうかなとか悶々と


新年早々、何だかもうどうでもいい気がしてきたです
てか苺BBS経済板のドラエモンさん お元気そうで何よりです

411 :名無しさん@勉強中 ★ :08/01/01 18:03:11 ID:???
メモ
http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy&page=0
のsubject.txt化

マッチ用正規表現
<b>[0-9]+</b> : * *(\([0-9]+\)) <a href="/cgi/15bbs/[^/]+/([0-9]+)/L30">(.+?)(</a> <font .+?\n)

変換式
$2.dat<>$3$1\n

412 :名無しさん@勉強中 ★ :08/01/03 14:28:06 ID:???
メモ
http://makimo.to:8000/i/
のdat化について

URL例
http://makimo.to:8000/i/d.cgi/livebase/2ch.net/live24/1187671540/?i=1001

正規表現
m#<hr>([0-9]+):(.+?):(.+?)(?:\[(.+?)\])?<br>(.*?)(<hr>)#mki

前処理
s#(<title>)29-(.+?</title>)#$1$2#ik
s#<a href=/i/d.cgi/.+?>(.+?)/(2ch\.net|bbspink\.com)/(.+?)/(\d+?)(/.*?)?</a>#http://$3.$2/test/read.cgi/$1/$4$5#igk
s#<a href=http://www\.google.+?>([^h\&].+?)</a>#http://$1#igk
s#<br><font color=\#000080>▼\d\d/\d\d/\d\d\(.\) \d\d:\d\d</font>##igk

変換結果式
$2<>$4<>$3<>$5<>

後処理
s#((?:^|\n).*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk



これって>>111>>115の再掲になるですが、これでdat化出来るかも。
ただ注意点が二つ。

(1) beリンクがはじめから消えている
(2) 連続スペース等はマージ(カッケー!)されてしまっているので
  AAが崩れてしまう

上2点は我慢するしかなさそうです。

413 :名無しさん@勉強中 ★ :08/01/03 15:13:48 ID:???
年月日の欄も省略されてるですか。
「2007/」ってのを日付の前に付ければ良いのなら
後処理で

s#((?:^|\n).+?<>.*?<>)#$1 2007/#igk

でその場しのぎにはなるですが。

ところでこれって

s#((?:^|\n).+?<>.*?<>)#$12007/#igk

ってやると「$12007」の部分で駄目だったのでやむなく半角スペース入れたですが
この場合どうやればいいんでしょうね。

あと、後処理でも
前処理の$serverや$boardみたいなものが欲しいなと思ったです
上のような事をやるのに結構使えるのではないかと。

414 :名無しさん@勉強中 ★ :08/01/03 15:47:07 ID:???
>>413の対処案
その場しのぎに変わりないですが。

s#((?:^|\n).+?<>.*?<)>#$1>2007/#igk

年をまたぐ場合はどうしましょう。
実況スレのようにせいぜい数日で終わる場合なら何とかなりますが
そうじゃない場合は・・・わかんない。

415 : ◆/vmukiyuzw :08/01/04 01:25:46 ID:070Pexro
dat→htmlに変換する時点で元データが加工もしくは改竄(?)されてしまってる場合、
どこまで元データに近づけるよう復元したいかは、個人的な割り切りしかない、と思います。
# その割り切りレベルが自分にはわからなかったのでmakimo.toにはなるたけ近づきたくなかった、
# と思うことはあります

で、>>413-414のように、「年」を復元するような作業も、力を入れても不毛かもとか思います。
板によっては数年かけて続いてるようなスレもありますし・・・
これもどこで割り切るか、という話になるかと思います。

416 : ◆/vmukiyuzw :08/01/04 02:39:50 ID:070Pexro
すみません。↑は私の板のほうに書くべきことだったような気がします。
申し訳ありません。

417 :名無しさん@勉強中 ★ :08/01/04 18:40:57 ID:???
8時から18時までみっちりと立ち回った後で
現在一息ついてますが
こういう毎日がまた始まると思うと
なんか何もかもどうでもよくなってきますね

>>415-416
自分もそう思うです。
ただ、>>318-335であれこれ考えた事と同様
何となくやってみただけの事なので
別にそんな大した事でもないです

ただ、思うんですが
意味のある事にしか意味がないという事はないと思うんですよ。
一見 無意味に見える事にも 必ず意味があるのではないかと。
そう思わなかったら意味がないじゃないですか。

ところで
私がやっている事って 意味があるんですかね?
もっというと
私が存在している意味ってあるのかなと。

別に誘い受けという訳でもないですが
こういう考えって 袋小路に迷い込みますね。

418 :名無しさん@勉強中 ★ :08/01/05 12:01:48 ID:???
最下部にぽっぷちゃっとをつけてみたのですが
同時接続人数を見て驚いたです
超人気ブログとかと同じくらいアクセスがあるではないですか
別にカウント数をごまかしてる訳でもないですし

と同時に
自前設置してある入室者表示スクリプトとの差異が気になったです
この違いは何なのだ

スクリプトは
http://myako.net/
の「入室者数表示スクリプト」を使わせて頂いてるのですが
もしかしたらホスト取得の箇所で
ほぼ同一アドレスのものが丸められているのかなとか素人は考えたですが
それ以上はなんとも。

該当個所は

# −−−−−−−−−− ホスト情報の取得 −−−−−−−−−−
sub host{
local ($host);
$addr = $ENV{'REMOTE_ADDR'};
$host = gethostbyaddr(pack("C4",split(/\./,$addr)),2);
if ($host eq ''){ $host = $addr;}
$host =~ s/,/./g;
return($host);
}

なので
$ENV{'REMOTE_ADDR'}に同じ数値が入る場合があるのだろうかと。
同じアパートの隣室同士とかどうなんでしょうか。

419 :名無しさん@勉強中 ★ :08/01/05 12:52:13 ID:???
ふと思ったですが
nicovideo.jpの時報と同様の事が
mirrorhenkanでも出来そうですね。
トップ右上で現在時刻と対応キーを現在形で表示させてありますが
そこの所でキリがいい時刻の時には
例えば「jihou.wav」をembedさせるようにする とか。
まあやんないですけど。

420 :名無しさん@勉強中 ★ :08/01/09 19:09:01 ID:???
http://society6.2ch.net/test/read.cgi/gline/1165245437/506

done(カッケー!)
でも使ってる人居るのかな

421 :名無しさん@勉強中 ★ :08/01/09 19:25:08 ID:???
syoboon - マイピクチャの整理
http://syoboon.asks.jp/78938.html
−−−−−−−−−−−−−−−−−−−−−−−
スレとかに貼られている画像や、ニュースとかの画像をしょっちゅう保存している割に
2006年から全く整理をしていないせいでマイピクチャを開くだけで
CPU100%になってしまうので、そろそろ整理でもしようかと。

ジャンルで分けると恐ろしく面倒になるので、タイムスタンプで分けようと思ったんですが、
ちょっと探した感じじゃそんなソフトは無いみたいですね、、、
−−−−−−−−−−−−−−−−−−−−−−−


ファイルをタイムスタンプで分けるようなソフトもどこかにあるとは思いますが
とりあえずwshで簡単に出来る(語弊があるけど)と思うです。

何らかの規則を設けてフォルダ分けする事にして
振り分けるフォルダが存在しなかったら作成するようにして
振り分け対象のフォルダを指定してその中のファイルのそれぞれについて
FileSystemObject(だったかな)でそれぞれのタイムスタンプを取得して
ファイル移動orファイルコピーすれば良さそうな感じ。

でもsyoboonさん もしかしたらLinuxオンリーの方なのかもしれず。
もしそうだとしたら、wshでスクリプトをこさえたとしても無意味なのかもしれず。
というか phpでも同様な事が出来るでしょうし
だもんでこの件 とっくに解決済みな事なのかもしれず。
まあスクリプト作ってもあたしゃチキンですから。



syoboon - liveb1終わってた
http://syoboon.asks.jp/79456.html

うわー。

422 :名無しさん@勉強中 ★ :08/01/11 19:30:23 ID:???
メモ

アニ関西Wiki
http://anikan.tv/

423 :名無しさん@勉強中 ★ :08/01/11 19:40:55 ID:???
http://society6.2ch.net/test/read.cgi/gline/1193462528/210-212n

「Linux使いなのでdat化出来ません」という御返事が返ってきたら
どうすればいいのでしょうか


そういえば
http://society6.2ch.net/test/read.cgi/gline/1165245437/502-503n
でMac使いの方も書き込んでおられるのですが
どうすればいいのでしょうか


まあどちらの件も
元気になったら考えてみようという事で。

424 :名無しさん@勉強中 ★ :08/01/11 19:44:34 ID:???
ところでもしかしたら
2ch-imodeの管理人さん 上記スレッドを見て
気が向いた時にアップされておられるのかもしれず。


だとしたら ありがとうございます

425 :名無しさん@勉強中 ★ :08/01/12 18:09:32 ID:???
メモ

2nv - 2ch News View
http://nika.sakura.ne.jp/2nv/index.html

管理人さんのお名前やブログを見てみると
どこかの研究室に所属されておられる理系の女性なのでしょうか。

426 :名無しさん@勉強中 ★ :08/01/13 13:37:33 ID:???
メモ

読めないdat落ちスレのhtmlミラー避難所[2] 2ch過去ログ保管予約
http://2ch.free4seo.com/reserve/view/369

これのdat化および
元URLからの表示が出来たら嬉しいです(私が)

dat化は何とかなるような気もしますが
一見したところ
本文の改行部分が全部なくなっているような。

あと 元URLからの表示のほうは
上記サイト管理人さんにお訊きしないとわかんない感じです。

427 :名無しさん@勉強中 ★ :08/01/13 14:07:04 ID:???
メモ
2ch過去ログ保管予約(http://2ch.free4seo.com/)のdat化について

URL例
http://2ch.free4seo.com/reserve/view/369

正規表現
m#<div class="author"><a name="\d+">([0-9]+)</a>名前:( ) Mail: (.*?) 投稿日: (.*?)</div>.+?<div class="post">(.*?) </div>#mik

前処理
s#(<title>.+?) 2ch過去ログ保管予約(</title>)#$1$2#ik


名前と本文改行がhtmlの段階からないみたいです。

あと前処理がうまくいかない感じなのは何でなのでしょうか。

428 :名無しさん@勉強中 ★ :08/01/13 14:09:20 ID:???
書き忘れ

変換結果式
メール欄逆転

429 :名無しさん@勉強中 ★ :08/01/13 18:45:32 ID:???
えーと
2ch-imodeさんの所なのですが
やはりこっそりとアップして下さっておられるようで
こっそりとありがとうございます

それはそうと
また少しhtml部分を手直しされたようで

http://mirror.sarashi.com/htmltodat/968412567.html

AASのリンクがあったりなかったりというのは今まで無かったですし
名前や日付あたりの半角スペースの有無もまた少し以前と異なっておられるような。



ちょっとまたこんがらがってしまってるので正規表現やりかけメモ
これだとレス11でストップひばり君です

m#<p>\[([0-9]+):(.+?) (?:≪(.+?)≫)? \((.+?)\) ?(?:<a href=.+?>AA</a>)?\]<br> ?(.*?) </p>.*?<hr>#mik

430 :名無しさん@勉強中 ★ :08/01/13 19:22:52 ID:???
メモ
2ch-i(http://2ch-i.net/)のdat化について

正規表現
m#<p>\[([0-9]+):(.+?)(?:≪(.+?)≫)? +\((.+?)\) ?(?:<a href=.+?>AA</a>)?\]<br> ?(.+?)</p>.*?<hr>#mik

前処理
s#(<title.*?): 2ch-i(</title>)#$1$2#k
s#<SCRIPT language="JavaScript">.+?</SCRIPT></body></html>##igk

変換結果式
メール欄逆転

後処理
s#(\n.*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk

431 :名無しさん@勉強中 ★ :08/01/14 12:00:11 ID:???
また後処理直すの忘れてた・・
上のだとレス1の名前欄にトリップがある場合にヒットしないです

後処理
s#((?:^|\n).*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk

432 :名無しさん@勉強中 ★ :08/01/14 18:32:14 ID:???
http://pc11.2ch.net/test/read.cgi/software/1195310686/851

しこしこ書いて一応投稿してみたのですが
「PC替えろ」で終わったら悲しいなと

433 :名無しさん@勉強中 ★ :08/01/16 20:26:57 ID:???
ふと思ったんですが

名前欄に

#fusianasan

とか

#山崎渉

とか書いて投稿したら
どう表示されるんですかね?
自分とこのホスト名なのか
それとも
それぞれに対応するトリップなのか。

ちなみにトリップ表示された場合
上は「◆M2TLe2H2No」
下は「◆RB/pr3SWUk」
となるみたいですが。


まあ試せばわかるでしょうけど
しかしそれにしても実に何とも限りなくどうでもいい話だ

434 :名無しさん@勉強中 ★ :08/01/19 19:51:52 ID:???
2ch-imodeさんの所なんですが
dat化したい際に問題がある場合があるみたい

http://mirror.sarashi.com/htmltodat/1171967272.html
http://mirror.sarashi.com/htmltodat/1200134001.html

例えばこの二つとかだと>>430で未変換行が出るです
上だとレス5と6
下だとレス258

で、調べてみると
どちらも超長文なので略されているみたいで。
これはちょっとどうしようもなさそうですね。

幸い、未変換行がすぐわかるので
それで省略レスを突き止めて各自手直しして頂くしかないのかな とか。

435 :名無しさん@勉強中 ★ :08/01/21 18:02:12 ID:???
メモ

ムッハー(*゚∀゚)=3 (http://muha.xrea.jp/
のdat化について

URL例
http://muha.xrea.jp/?q=http://society6.2ch.net/test/read.cgi/gline/1165245437/

正規表現
m#<div.+?><dt.+?><input.+?> ([0-9]+) : <label.+?>()<b class="name">(.+?)</b> (.+?)</label></dt><dd>(.*?)</dd></div>#mik

前処理
s#<title.+?/title>##ik
s#<h2>(.+?)</h2>#<title>$1</title>#ik

後処理
s#(<><>)\[(.*?)\](.+?)(<>)#$1$3 $2$4#igk
s#((?:^|\n).*?)(◆.+?)(<>)#$1</b>$2<b>$3#igk


ほんの4日前に開設なさった所みたい。
メール欄は省略しておられるようです。

436 :名無しさん@勉強中 ★ :08/01/21 18:43:33 ID:???
とかいって
仕様を見てみると
そうでもないようで

http://muha.xrea.jp/template.txt

ごめんよくわかんないです

437 :名無しさん@勉強中 ★ :08/01/21 19:03:06 ID:???
スレッドタイトルとかあんまり気にしないように

ギンギンに勃起した娘。メンバーたちにマワされたい2
http://f57.aaa.livedoor.jp/~moshimo/moshimo_log/moshimo475.htm

検索してたらこれが出てきたんですが
最下部を見てびっくりしたですよ

438 :名無しさん@勉強中 ★ :08/01/22 18:20:01 ID:???
>>435でやったものですが、後処理が間違ってたですね。
これだとIDが表示されないです。

こうかな

後処理
s#(<><>)\[(.+?)\](.+?)(<>)#$1$3 ID:$2$4#igk
s#(<><>)\[\](.+?)(<>)#$1$2$3#igk
s#((?:^|\n).*?)(◆.+?)(<>)#$1</b>$2<b>$3#igk

439 :名無しさん@勉強中 ★ :08/01/22 18:27:38 ID:???
このサイトですが
Web製作板でお見かけしたです

まとめサイト運営してる人 Part2
http://pc11.2ch.net/test/read.cgi/hp/1148609976/704
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
704 名前:Name_Not_Found[sage] 投稿日:2008/01/17(木) 05:44:10 ID:???
こんなもの作ってみたよ。
とりあえず抽出機能だけ付けた
ttp://muha.xrea.jp
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−



で、まあ
色々な人が居るですが
下の方とか

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
750 名前:Name_Not_Found[sage] 投稿日:2008/01/21(月) 21:40:16 ID:???
プログラミングとしては初級だろうな
ただこの板にプログラミングかじった奴が居なさすぎるから神なんて言われる
こりゃただの文字列操作に過ぎない
誰でも作れるから、誰も作ろうとしなかっただけさな
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

こういうのって見ないほうがいいだけなんでしょうけど
本物のすごい人はわざわざこんな事書かないだろうなと

440 :名無しさん@勉強中 ★ :08/01/22 19:28:53 ID:???
メモ

Internet Archive Wayback Machine
http://web.archive.org/web/*sr_1nr_2653/http://2ch.dumper.jp/*

dumper.jpさんの所のファイルですが
webarchiveにだいたい1500スレ前後残っているみたいなので
スクリプトでスクレイピング(カッケー!)すれば
ある程度 半自動でリスト生成出来るかもです

って そんなスクリプト 誰が作ってくれるんでしょ

441 :名無しさん@勉強中 ★ :08/01/22 20:47:36 ID:???
少し考えてみると

上のソース(http://web.archive.org/web/*sr_1nr_2653/http://2ch.dumper.jp/*
から拾い上げたいリンクは例えば下記

<a href="http://web.archive.org/web/20050614012049/2ch.dumper.jp/0000015881/">2ch.dumper.jp/0000015881/</a><br>
<span class="mainSearchText">1 page from Jun 14, 2005</span><br><br>
<a href="http://web.archive.org/web/*hh_/2ch.dumper.jp/0000017733/">2ch.dumper.jp/0000017733/</a><br>
<span class="mainSearchText">~2 pages between Jan 07, 2007 and Jan 12, 2007</span><br><br>

このうち
(1) 上は1ページしか保存されてない(1 page from Jun 14, 2005)ので
 http://web.archive.org/web/20050614012049/2ch.dumper.jp/0000015881/
 をDLするなりして分析すれば良いと思うですが

(2) 下は2ページ保存されている(2 pages between Jan 07, 2007 and Jan 12, 2007)ので
 http://web.archive.org/web/*hh_/2ch.dumper.jp/0000017733/
 へ行って各々のアーカイブを見てみる必要がありそうです。

とりあえず(1)と(2)の区分けですが
リンク先URLの正規表現で何とかならないかな?

並べると
http://web.archive.org/web/20050614012049/2ch.dumper.jp/0000015881/
http://web.archive.org/web/*hh_/2ch.dumper.jp/0000017733/
となり
複数ページ保存の場合のURLは「〜/+hh_/〜」というのが他にもついているので

1ページしかないものは
http://web\.archive\.org/web/\d+/2ch\.dumper\.jp/\d+/
複数ページ保存されているものは
http://web\.archive\.org/web/\*hh_/2ch\.dumper\.jp/\d+/
とやって
上にマッチしたらDL
下にマッチしたら別個リストに追加 とか。

442 :名無しさん@勉強中 ★ :08/01/23 20:59:36 ID:???
>>435>>438ですが
beや株主優待や●みたいなのがIDの後に付くような所だと
これではよくないっぽいですね。
試してないですがレス1とか多分よくないかもです

いやー奥が深いなぁ (←勝手に深くしてるだけだったりして)

443 :名無しさん@勉強中 ★ :08/01/23 21:27:02 ID:???
メモ
2chミラー計画(http://web.archive.org/web/*/http://fun.kz/
のdat化について

URL例
http://web.archive.org/web/20050221015734/http://fun.kz/test/read.cgi/comic/1085912649/

正規表現(「行が長い」と出たので適当に改行してます)
m#<div class="day"><a.+?>([0-9]+)</a> 名前:(.*?) ?\[(.*?)\] 投稿
日:(.*?)<br><div class="body"> ?(.*?) </div></div>(<div class="day">|[  ]+(?:<hr.*?>|<div align="center">))#mik

変換結果式
メール欄逆転


前スレ651のコピペですが。

444 :名無しさん@勉強中 ★ :08/01/23 23:29:49 ID:???
http://pc11.2ch.net/test/read.cgi/software/1195310686/910

更新なさったですが
http://pc11.2ch.net/test/read.cgi/software/1195310686/870-872n
の要望は見送られたみたいで。

駄目なのかなあ

445 :名無しさん@勉強中 ★ :08/01/26 20:15:00 ID:???
更にをミラーを3つ追加してみたりして

あと
(1) http://ruku.qp.tc/
(2) http://2ch.dumper.jp/
(3) http://2ch.pop.tc/

消えてしまったそれぞれのhtmlミラーの
http://web.archive.org/に保存されているもののリストでも作ってみようかなと。

446 :名無しさん@勉強中 ★ :08/01/27 12:28:54 ID:???
http://society6.2ch.net/test/read.cgi/gline/1193462528/247-249n

ふむ
その1bでも1001レスあるみたいですし
少しだけ携帯用のも追加してみますか

447 :名無しさん@勉強中 ★ :08/01/27 13:16:41 ID:???
というか
その20にもあるなあ

でも公式p2にはdatが存在してないですし
色んなケースがあるんだなーと。


ちなみに

http://society6.2ch.net/test/read.cgi/gline/1193462528/245-246n



http://etc3.2ch.net/test/read.cgi/charaneta/1107347770/

も、dat落ち保管所さんがアップなさったものがwebarchiveに残ってるみたい。

天使のしっぽ3 トラウマなんてこわくない!
http://web.archive.org/web/20060723021603/http://2ch.pop.tc/log/05/10/05/0723/1107347770.html

448 :名無しさん@勉強中 ★ :08/01/27 14:54:47 ID:???
メモ

Internet Archive Wayback Machine
http://web.archive.org/web/*sr_1nr_1368/http://www.2chdat.net/*
http://web.archive.org/web/*sr_1nr_1929/http://user.ftth100.net/mirrorhenkan/*

449 :名無しさん@勉強中 ★ :08/01/27 18:23:32 ID:???
http://qb5.2ch.net/test/read.cgi/operate/1201374777/25-26+40-43

再び
キャッシュサーバを用意して下さるのでしょうか

450 :名無しさん@勉強中 ★ :08/01/27 20:01:16 ID:???
>>445で書いたwebarchiveに保存されているhtmlですが
いちおうやってみたらそれぞれ

(1) http://ruku.qp.tc/
   →18108

(2) http://2ch.dumper.jp/
   →1527

(3) http://2ch.pop.tc/
   →4880


という事のようで。
>>195で出したwshとhtmltodatが大活躍してくれました。

451 :名無しさん@勉強中 ★ :08/01/28 20:40:27 ID:???
上の間違ってるっぽい
dumper.jpさんのはちょっと見てないですが
他二つやり直してみたです

(1) http://ruku.qp.tc/
   →19901

(3) http://2ch.pop.tc/
   →4864

たぶんこれで合ってるんじゃないかと。
リストを出しとくです

http://mirror.sarashi.com/webarchive/ruku.txt
http://mirror.sarashi.com/webarchive/2chpop.txt
http://mirror.sarashi.com/webarchive/dumper.txt

「URLリストを出されてもそれでどうしろと」とか言われそうですが
さあこっちでもどうしたものか。

全部合わせて2メガくらいのデータになるので
JavaScriptで検索するのはちと重そうですし
これ以上増える事もなさそうな静的ファイルなので
適当な検索CGIと連動させるようにでもしてみますか。

452 :名無しさん@勉強中 ★ :08/01/28 21:02:27 ID:???
ミラーをも一つ追加してみたです

>>451のリストファイルですが
dumper.jpさんのものはそのままでは使えないですね。
それぞれのミラーに対応するdatキーを拾わなければならなそうです

1500スレッドという事なので
手動でいちいち覗いて元スレを探すのはとてもとても。
それ用にスクリプトを考えたほうが速そうだ(って 出来るのかいな自分)

「急がば回れ」という奴ですか。
「労力を惜しむ為の労力を惜しまない」という言い回しもありますな

453 :名無しさん@勉強中 ★ :08/01/29 19:29:03 ID:???
メモ

JavaScriptによる全文検索エンジン - llameradaの日記
http://d.hatena.ne.jp/llamerada/20070123/1169566034

454 :名無しさん@勉強中 ★ :08/01/29 19:58:53 ID:???
JavaScript を用いて Brass Band Podcasting の全エントリを検索
http://blechmusik.xrea.jp/brasscast/search/

455 :名無しさん@勉強中 ★ :08/01/30 21:46:19 ID:???
何かリロードバーボンがきついみたいなので
一時的にプレビュー表示をやめてみたです
何か言われてもへこむのでここで

ところで
このバーボン回避は他の方々どうされておられるのかとあちこち見てたら
けっこうミラーや中間サーバを出されている方もいらっしゃるんですね。
という訳でまた追加してみたです
こんな状態でこんな事するなんて
私は鬼か鬼なのか

456 :名無しさん@勉強中 ★ :08/01/31 20:12:52 ID:???
キャッシュサーバがカタチになられたようで。

【Love Affair】携帯からのアクセスに対する考察・次の一手 Part4 - ボーリング場
http://qb5.2ch.net/test/read.cgi/operate/1201374777/l50


調べようと思ったらsyoboonさんの所に。

syoboon - r.so
http://syoboon.asks.jp/82970.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
datはこっち
http://bg20.2ch.net/test/r.so/{server}/{dir}/{key}/
subject.txtはこっち
http://bg20.2ch.net/test/p.so/{server}/{dir}/
↑必ず最後のスラッシュは必要みたい。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


DinoSwiftさんの所もこれでリロードバーボン回避出来るようになるかも。


で、落ち着いたら自分のとこも
datget関係のスクリプトを全部見直してみますか。

457 :名無しさん@勉強中 ★ :08/02/02 11:53:38 ID:???
何か本当に色々あるだなぁ・・・

【スレッド】2ch型掲示板 14 【フロート型】
http://pc11.2ch.net/test/read.cgi/php/1127896640/950-952n


いちおう書いてはみたですが
その前にまず
すっげー大事な事がひとつあるのです


これやるとしたら
まずPerlスクリプトの読み方からまず思い出さないと。
というか
勉強し直さないといかんです



付け焼き刃はこれだから。

458 :名無しさん@勉強中 ★ :08/02/02 19:27:50 ID:???
MOONGIFT: ≫ JavaScriptを使ってSQL調にデータを検索「JsonSQL」:オープンソースを毎日紹介
http://www.moongift.jp/2008/02/jsonsql/
VBAエンジン
http://www2s.biglobe.ne.jp/~iryo/java/java1/engform.html
最速インターフェース研究会 :: Ajaxを使ったシンプルなチャット
http://la.ma.la/blog/diary_200507290022.htm

459 :名無しさん@勉強中 ★ :08/02/02 19:34:06 ID:???
[JSAN] JavaScriptライブラリ検索 - JSAN Search Kawa.netブログ(川崎有亮)/ウェブリブログ
http://kawa.at.webry.info/200605/article_4.html

460 :名無しさん@勉強中 ★ :08/02/03 09:23:59 ID:???
中国2chさん
トップに行ってみたら

http://cn2ch.cn
−−−−−−−−−−−−−−−
応該結束的遅早還是会結束
byebye
−−−−−−−−−−−−−−−

簡体字の読解力がそう高くないのでgoogle翻訳で繁体字に直して
本字を現代日本で使ってる文字に直してやっと理解出来たんですが
「ここ遅かれ早かれ終わりですバイバイ」って書いてあるのかなと。
掲示板をJaneNidaに登録してたんで知らなかったです。

ブログその他 リンクがないですがアクセス出来るですけど
何だか残念だなあ・・・

461 :名無しさん@勉強中 ★ :08/02/03 12:01:43 ID:???
メモ

実験中の何か
http://bbs.bp.to/

ボード一覧がずっと更新されておられないみたいですが
今まで読み込んだものでdat落ちしているものが読めたら嬉しいです(私が)
よく見てないですが。



2ちゃんねるログ勝手に保管所
http://metabolism.que.jp/logs/

462 :名無しさん@勉強中 ★ :08/02/03 16:44:58 ID:???
http://wota.jp/morningcoffee/maiha/read.php/1189468917/l10

http://2ch.auken.jp/?

http://cm.umu.cc/2ch.php

463 :名無しさん@勉強中 ★ :08/02/04 20:12:34 ID:???
>>457のスレッドで御返事があったので
また書いたですが

http://pc11.2ch.net/test/read.cgi/php/1127896640/950n-

そろそろ
「日本語でおk」
「○○まで読んだ」
みたいな茶々があってもおかしくないかなと。



てか
誰か替わってくんないもんかなー。
引き継いでくれる人が出てこないかなと切実に思うです
自分 Perlも携帯も絵文字もよくわかんないんで。

464 :名無しさん@勉強中 ★ :08/02/04 20:24:44 ID:???
メモ
携帯絵文字関連

日本語処理・携帯絵文字処理関係のperlモジュール
http://www.kawa.net/works/perl/i18n-emoji/i18n-emoji.html
プログラミング
http://onlyaffiliate.blog43.fc2.com/blog-category-33.html
絵文字を使いこなして見るためのページ
http://trialgoods.com/emoji/


おまけ
結構売れてるのね

Webプログラム制作【Potora】
http://potora.dip.jp/

465 :名無しさん@勉強中 ★ :08/02/04 20:44:18 ID:???
これがうまくいったら
絵文字表示出来る2chタイプのphpスクリプトもやってみますか
ってまた追い込もうとしてるのか自分



絵文字データベースと相互変換マッピングデータベースのJSONファイルを公開します。 : アシアルブログ
http://blog.asial.co.jp/330

466 :名無しさん@勉強中 ★ :08/02/05 20:03:36 ID:???
さて
Softbank携帯の絵文字の文字コード範囲を特定しようとしたら
何だか本家オフィシャルにも載ってないような。
まあ んなこたあないですよね。
私の目は節穴なので見つからなかっただけでしょう。



SoftBank携帯でShift_JISページのフォームから飛んでくる絵文字のバイナリコード - ゆどうふろぐ
http://d.hatena.ne.jp/Yudoufu/20071102/1193992749
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ただ、自分で色々調べてて、どこにもこの件の情報がないので
あとからまたやる人は苦労するんじゃないかなーと思ってちょっとメモしとく事にしました。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

ゆどうふさんの心の広さ優しさに感動したです!ありがとうありがとう!
感謝感激ヒデキ還暦あと8年!

−−−−−−−−−−−−−−−−−−−−−−−
で、絵文字の範囲は、SoftBankの絵文字番号順に

1. [0xF9][0x41-0x9B]
2. [0xF7][0x41-0xF3]
3. ここでNo.264 - No.270がスキップ。
4. [0xF9][0xA1-0xED]
5. [0xFB][0x41-0xD1]

で、No.1 - No.478まで、でした。
−−−−−−−−−−−−−−−−−−−−−−−

467 :名無しさん@勉強中 ★ :08/02/05 21:08:31 ID:???
メモ
これでどうだろうか


$sjis = '[\x81-\x9F\xE0-\xEF\xFA-\xFC][\x40-\x7E\x80-\xFC]|[\x00-\x7F]|[\xA1-\xDF]';
$emoji_sb = '[\xF9][\x41-\x9B]|[\xF7][\x41-\xF3]|[\xF9][\xA1-\xED]|[\xFB][\x41-\xD1]';
$elem[3] =~ s/\G((?:$sjis)*)($emoji_sb)/$1.'&#'.unpack('n',$2).';'/ego;

open(SBDATA,"<softbanksjisdata.txt") || die "can not open file02";

foreach(<SBDATA>){
chop;
@_ = split(/\t/);

$elem[3] =~ s/$_[1]/'<img src=..\/..\/..\/imgs\/j\/'.$_[0].'.gif>'/eg;
}

close(SBDATA);


どうだ全然わかんないだろう
自分も何が何やら。
まだ覚えていた頃に書いたコードを真似しただけですが
これで良いのかどうか。

とりあえず
$elem[3] =~ s/\G((?:$sjis)*)($emoji_sb)/$1.'&#'.unpack('n',$2).';'/ego;
のunpack部分は違ってるかも。

これで合ってたとしても
softbanksjisdata.txtに書く変換表を478行用意しないとならないかも。
頭が痛くなりそうだ。

imodeとezwebの変換表の時はというと
公式にあったpdfファイルを印刷して一つ一つ手入力したですが
softbankにもそういう公式情報があったら嬉しいのですが。

468 :名無しさん@勉強中 ★ :08/02/05 22:09:25 ID:???
http://pc11.2ch.net/test/read.cgi/php/1127896640/961

投稿した直後から少し後悔してるです
尾を引きそうだ

469 :名無しさん@勉強中 ★ :08/02/06 17:30:41 ID:???
>>467
どうやらunpackで良さそうですね。
単に16進数表示させるようにしたいだけなんで。

http://tohoho-web.com/wwwperl2.htm#unpack

ところで、このコード中の$elem[3] ってーのにはdatファイル中の本文部分が入ってるんですが
名前やタイトルにも絵文字がある場合があるんで
その場合は$elem[0]と $elem[4]に書き換えれば良さそうですが
いっその事サブルーチンにしてしまえば楽なのかもです。

470 :名無しさん@勉強中 ★ :08/02/06 20:16:33 ID:???
さて
ReplaceStr.txtでも$EXTRACTを使えるようにして頂けたら
youtubeやnicovideoその他のサイトで
flvファイルへのリンクを出来るようになると思うんですが
要望してスルーされると寂しくなるしなー。

ImageViewURLReplace.datで代用出来たらいいんですが
画像のみみたいですし
うーむ・・・

471 :名無しさん@勉強中 ★ :08/02/09 18:39:32 ID:???
http://pc11.2ch.net/test/read.cgi/php/1127896640/963

絵文字コードを画像リンクにする方法ですが
薄皮を剥ぐように
うっすらと少しづつ
思い出してきたような気がします

覚えているうちに何かしておかないと
また虚空へかき消されてしまう
でも現実生活のほうでいろいろやらなければならなくて
余分な事する余裕が無さそう
ああこのジレンマ

472 :名無しさん@勉強中 ★ :08/02/10 12:27:49 ID:???
あれこれ調べながら読んでみて
ああこれ間違いなく私が書いたコードだなあと。
勿論あちこちのサンプルコードからコピペしたツギハギなんですが。

で、今までのコードだと
imode10進数とvodaphoneのそれが混同してしまってたっぽいのでちょっと手直し。
それにしても、vodaphoneって旧j-phoneにして現softbankって事になるんで
いやー目まぐるしいなあ。

で、色々見てみると
http://www.45ch.tv/
で出されていたEZwebビルトインアイコンの追加箇所がわかったので
それも追加してコードも変えてみようかなと。



ただ、コード範囲がよくわかんない。誰かまとめてないかなー。
まとめた方も居られるかもですが、見つからない場合は下のから特定しようかと思うです

EZwebの絵文字(全部)
http://cgi.wap2.jp/emoji/ezweb/?act=table



ついでに見てみると
DocomoとAUはうまく絵文字コード住み分けされてるんだなあと。

EZwebの絵文字(全部)
http://cgi.wap2.jp/emoji/ezweb/?act=table


開発者(カッケー!)側からしてみると
softbank絵文字ってほんとエイリアン来襲みたいな感じだと思ったり思わなかったり。

473 :名無しさん@勉強中 ★ :08/02/10 13:48:36 ID:???
>>471の全部コードから書き出してやってみたら
うまくいっている模様。

>>466のゆどうふさんに倣い書いとくです


EZwebの絵文字コード範囲は

[0xF3][0x40-0x7E,0x80-0xFC]
[0xF4][0x40-0x7E,0x80-0x93]
[0xF6][0x40-0x7E,0x80-0xFC]
[0xF7][0x40-0x7E,0x80-0xA8,0xAC-0xFC]

みたいです。

474 :名無しさん@勉強中 ★ :08/02/10 17:48:54 ID:???
いちおう出来たっぽいのでお伺いしてみたです

http://pc11.2ch.net/test/read.cgi/php/1127896640/965-966n

ウザいですかそうですかごめんなさい

475 :名無しさん@勉強中 ★ :08/02/10 18:41:00 ID:???
http://pc11.2ch.net/test/read.cgi/php/1127896640/967

まあ予想出来ていたので別にいいです
まともな反応が無ければこの件それまでという事で


関係ないですが
後の推移を見るにつけ
「作るんじゃなかったなーこれ」
というものが結構ありますね。
具体的にはよう言わんですが

476 :名無しさん@勉強中 ★ :08/02/11 09:34:10 ID:???
「これってスレッドフロート掲示板の話じゃないよね」
という書き込みがありましたが
スレッドの1から見てみると
ゼロから掲示板スクリプトをやってみましたという投稿に対して
「そんなのイラネ」「0ch使えばいいじゃん」
というような反応ばかりだった訳で。

例えばJane外部コマンドスレでスクリプトの話がけっこう出ているのに
「それは外部コマンドの話じゃないよね」
と茶々を入れるようなものではないかなと。


それはともかく
絵文字表示スクリプト
全部書き直したくなってきた・・・
ニーズとは関係無しに。

477 :名無しさん@勉強中 ★ :08/02/11 09:39:45 ID:???
とりあえず
最新(?)の文字コード範囲でやり直したものに差し替えてみたです
read.cgiはまだですが

http://mirror.s151.xrea.com/emoji/emoji/

これ見ると
ASTEL絵文字だった領域が
全部AU絵文字領域にとって代わってしまっているみたい。
あとMac投稿では少しコードが変わるみたいで。

478 :名無しさん@勉強中 ★ :08/02/11 09:44:41 ID:???
メモ

i-mode絵文字コード範囲

[0xF8][0x9F-0xFC]
[0xF9][0x40-0x7E,0x80-0xFC]

479 :名無しさん@勉強中 ★ :08/02/11 11:23:20 ID:???
>>477の板
read.cgiも差し替えたです
あとはまともな反応があるまで
この件ここまでという事で



思うんですが

「0chありゃ他のイラネ」
「yykakikoあれば同上」

とか書いてる人って

「にくちゃんねるあるからみみずんイラネ」

とか書いてた人たちと同じにおいを感じるです
これ暴言になるかなとは思うですが。



それにしても、考えなしにそういう事書いてた人たちって
今どうしてるんでしょうね。
私の所を使ってるのかな。

480 :名無しさん@勉強中 ★ :08/02/12 12:35:53 ID:???
ぐらめぬ・ぜぷつぇんのはてダ
http://d.hatena.ne.jp/msakamoto-sf/

481 :名無しさん@勉強中 ★ :08/02/12 19:57:21 ID:???
日がな一日寒空の下にいると
ほんと疲れちゃう

鏡の国(http://script.s16.xrea.com/)のスレッドフロートphp掲示板スクリプトを
絵文字表示化してみようかと読み込み中
やっぱりperlよりphpのほうが読みやすいわ
問題は、perlのpack/unpack/sprintf/while/chop
をphpでどのように書き換えるかなんだけど
みんな何とかなりそうじゃないですか。

482 :名無しさん@勉強中 ★ :08/02/14 08:00:08 ID:???
笑われそうな話ですが

0chスクリプトのそこかしこに例えば

$allPath= $oConv->CreatePath($this->{'SYS'},0,$this->{'SYS'}->Get('BBS'),$key,'');

みたいに「->」というのがあるんですけど
これってどういう意味なんでしょうか。

検索してもよくわからない。
オブジェクト指向プログラミングでの継承だか外部ソースへのアクセスメソッドだかみたいかもですが
何だかよくわかんない。

てか
「オブジェクト指向」って何なんだろう・・・
いろんなものに喩えて説明しているんですけど正直よくわかんない。

オブジェクト指向の基礎 [Perl講座 -Smart]
http://www.rfs.jp/sb/perl/04/02.html




やはり基本が出来てないと駄目ですね。
下のエントリーとか見ると「モノが違うな」と思うです


\(^o^)/ - まさにっき(使えないプログラマーの記録)
http://d.hatena.ne.jp/seiunsky/20080125/1201307890#c

483 :名無しさん@勉強中 ★ :08/02/14 19:20:09 ID:???
やっと説明しているサイトがあったですよ

Perlオブジェクト指向プログラミング
http://www.rwds.net/kuroita/program/Perl_oo.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
パッケージ名->サブルーチン名で、パッケージ中のサブルーチンを探して、
それに引数を与えます。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

で、>>482はこちらかな

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
パッケージ名だけでなく、オブジェクトでもいいのです(refで見たとおり、
オブジェクトは、自分が属しているパッケージ名を知っているから)。

$obj->something(引数);

とすると、$objが関連付けられているパッケージ(今の場合、Stone パッケージ)
内にある、 somethingサブルーチンを実行します。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


という事は

$allPath= $oConv->CreatePath($this->{'SYS'},0,$this->{'SYS'}->Get('BBS'),$key,'');

$oBonvが関連づけられているパッケージ内にあるCreatePathサブルーチンを実行
 ↓
CreatePathサブルーチン処理:
  $thisが関連づけられているパッケージ内にある


途中ですがちょっとわかんなくなったんで
上のページを精読してみるです

484 :名無しさん@勉強中 :08/02/14 19:37:05 ID:pM3srDy0
>>482
「->」これはPerlの矢印演算子です。左辺をデリファレンスします。
@array = ('hoge','hige','hage');

485 :名無しさん@勉強中 :08/02/14 19:39:39 ID:pM3srDy0
途中で書き込んでしまった
と思ったら答えを見つけたのでよさそうです。

この場合はPerlでオブジェクト指向を実現するために使われます。
> $allPath= $oConv->CreatePath($this->{'SYS'},0,$this->{'SYS'}->Get('BBS'),$key,'');
変数$oConvのオブジェクトのCreatePathメソッドを呼びます。

486 :名無しさん@勉強中 :08/02/14 21:21:03 ID:fXA8w4Uy
(><;)

487 :名無しさん@勉強中 ★ :08/02/15 20:31:58 ID:???
説明サイトを読んでから0chスクリプトを見てみると
packageとかコンストラクタとかshiftとかblessとかあって
教科書通りだうおーすげーとか思ったです
完全にオブジェクト指向を踏襲しているスクリプトなのですね。
こりゃオブジェクト指向をマスターしないと手をつけられないのかも。

とりあえず見よう見真似でsoftbank絵文字リンクをつけてみたです
あとは0ch最新版にのせかえて出すですな

やろうと思えばいろいろあると思うですが
早く片付けないと精神的に開放されないです


>>484-485
ごめんなさいごめんなさい
途中で止められても全然わかんないのです
申し訳ないのですが教えて頂けないでしょうか
寸止めプレイでじらされると 興奮しちゃう
ってごめんなさい
ああごめんさいごめんなさい

>>486
がんばりましょう

488 :名無しさん@勉強中 :08/02/15 21:29:09 ID:SyuqxcwJ
>>487
「package クラス名」は他の言語での「Class クラス名」に相当する文。
blessはPerlでオブジェクト指向を実現する上で必ず必要な関数。
blessしないとオブジェクトにならない。

shiftは使わなくてもいいんだが、引数が格納される配列@_の最初にパッケージ名(クラス名)
が入っているのでこれを@_から除かないと引数を使うときに2番目(添え字では1)から
はじめなければいけないから。

じゃぁ矢印演算子についてもうちょっと。
# Example これはオブジェクト指向とは関係アリマセン
%hash = ('aho' => 'hige','baka' => 'hage'); # %hashはハッシュです。
$hash_ref = \%hash; # $hash_refにはハッシュのリファレンスが入ります。
print $hash{'aho'}; # => hige
print $hash_ref->{'baka'}; # => hage
# Example End
$hash{'aho'}は%hashの'aho'という要素にアクセス。
対して、$hash_ref->{'baka'}は$hash_refという変数をデリファレンスして、'baka'という要素にアクセスします。

Perlのオブジェクトは、全て既存の型(変数、配列、ハッシュ)のリファレンスです。
たとえば、Carというクラスがあったとしましょう。
my $kuruma = Car->new('TEST');
# ↑の文の矢印演算子はパッケージを指定する用法。$kuramaに入るのは何かのリファンレンス
$kuruma->hashiru('fast');
# ↑の文は「&Car->hashiru($kuruma,'test');」「&Car::hashiru($kuruma,'test');」と同義。
# ただ、↑のように書いたほうがオブジェクト指向プログラミングらしいというだけ。

# Perlのオブジェクトの実体は単なるリファレンスなので、
# $kurumaがハッシュリファレンスだったとすると、↓のように直接インスタンス変数にアクセスできる。
$kuruma->{'syasyu'} , $${kuruma}{'syasyu'}

489 :名無しさん@勉強中 :08/02/16 01:42:44 ID:vhUmtm1L
2ch DAT落ちスレ ミラー変換機 ver.4
いつも使わせて貰ってます。かなり変わってしまいましたね。

ところで、その9での取得したログなんですが、
・「その9」の整形方法はこちらにまとめてみました。ってところから
snapshotのスレをdat化する試みについて ってのでやってもエラーが出ます。
従来はできていたのですが、どうもリニューアルされているみたいで、
おそらく、前処理にさらに追加が必要の様なのです。

つきましては前処理のスクリプトの追加(変更?)をお願いしたいのですが、
対応いただけますでしょうか?

490 :名無しさん@勉強中 ★ :08/02/16 20:05:57 ID:???
>>483のページを紙に印刷してみたです
しめて22枚
よーし読むぞー

>>488
ありがとうございますです
恥ずかしながらよくわかんないので(何がわかんないのかもわかんないので)
とりあえず文章を印刷させて頂きましたです
よーし読むぞー


関係ないですが
「何がわかんないのかもわかんないので何を訊いていいのかわかんない」
という状態って
学校の授業とかでいやというほど経験したっけだなー
と下記エントリーを見て思ったり。

裏おんな | 『たったひとつの答え』
http://uraonna.blog31.fc2.com/blog-entry-158.html

今やってる事なんかも
授業で出ていたら猛烈に拒否反応を起こしてるだろうなと。



>>489
とりあえず
http://p2.chbox.jp/read.php?host=society6.2ch.net&bbs=gline&key=1165245437&ls=all

http://www.geocities.jp/mirrorhenkan/snapshot/
の正規表現その他でやってみたらdat変換出来たですが
例えばどのスレッドで出来なかったのでしょうか。
(スパムがひどくなったので この板、アドレスはh抜きでないと投稿出来ないです)

491 :名無しさん@勉強中 ★ :08/02/17 19:32:46 ID:???
ところでsnapshotdat化用の前処理は簡易版でばかりやってたので
すんげー遅いなと思ったですが
これどうしようもなさそうですね。
snapshotのリロードバーボン多発でp2todatも使えないケースが多くなったです
例えば下記スレッドってsnapshotには無いっぽいし
みみずんさんの所にも無さそうですし
23ch.infoさんの所からdat化させてもらって読んでみたり。

ブラック会社に勤めてるんだが、もう俺は限界かもしれない
http://yutori.2ch.net/test/read.cgi/news4vip/1195907887/


これってひろゆきさんが連絡をとりたがっておられたみたいだし
また書籍化されるんでしょうか。

http://qb5.2ch.net/test/read.cgi/operate/1199187475/911,965,971-
http://qb5.2ch.net/test/read.cgi/operate/1201205183/14,24,100

492 :名無しさん@勉強中 ★ :08/02/17 20:03:22 ID:???
23ch.infoさんのdat化は>>407のでやったです
wshでのdat化は遅い遅い


で、このスレッドなんですが
nikaさんの所でも保管なさっておられるですが
今見たらdatのURL書式がマイナーチェンジされたみたいで
proxomitronのリダイレクトフィルタ経由ではエラーになってたです

URLはというと

html
http://com-nika.osask.jp/bbs/bbs.php?http://yutori.2ch.net/test/read.cgi/news4vip/1195907887/
dat
http://com-nika.osask.jp/test/dat.cgi/news4vip/1195907887/

このdatの書式なんですが
以前は確か

http://com-nika.osask.jp/test/dat.cgi/news4vip/1195907887.dat

だったような。

proxomitronフィルタの作り方忘れちゃったなー。
正規表現が独特だしなー。


で、それとは別に

そうなると
携帯版変換機の nikaさんとこのURL形式も直さないといかんのですか。
最近perlばかりでphpの書き方忘れちゃったなー。

493 :名無しさん@勉強中 ★ :08/02/17 20:45:58 ID:???
ソフトバンク、第3四半期決算は大幅な増収増益孫氏「今年はインターネット元年」と改めて強調 - しんさんの出張所 はてな編
http://d.hatena.ne.jp/shin/20080207/p5
http://k-tai.impress.co.jp/cda/article/news_toppage/38396.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
 さらに、「私自身が、全ての端末機の企画にのめりこんでやっているので、
それなりの特徴と性能、アピールできる点がないと出さないという強い決意で
やっている。単に品揃えを増やすのではなく、良いものを増やしていく。(後略)」

・・・

トップ自らが端末の一つ一つにチェックをするという力のいれ方がよくわかる面白い内容でした。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−



孫引きになるですが(ってまるでシャレみたいですが)

孫社長自らが携帯端末にチェックを入れているとの事ですが
絵文字コードの不統一さとかもわかってやっておられるのかなとか思ったです。
AUと絵文字コードが被るのはともかく(ってそれ自体も悩ましい事態ですが)
Shift_Jis第二水準(?)の漢字と文字コードが重複しまくってるのってどうなのよと。

例えば下のスレッド
漢字部分までSoftbank絵文字浸食しているのってどうなのよと
どうすりゃいいのさ濃い口醤油と

http://mirror.s151.xrea.com/emoji/test/read.cgi/emoji/1180412107/41

494 :名無しさん@勉強中 ★ :08/02/17 21:01:06 ID:???
AU絵文字との被り具合もすごいです
上下比較すると実に判りやすい

http://mirror.s151.xrea.com/emoji/test/read.cgi/emoji/1180412107/41
http://mirror.s151.xrea.com/emoji/test/readsb.cgi/emoji/1180412107/41

で、これらとは別に
Softbank3G絵文字を最優先表示するようなものも更に作らないといけないようで。

あんまりだ、あんまりだ。

495 :489:08/02/18 11:14:29 ID:dQ5deoi1
>>490
せっかくレスを貰っていたのに遅くなって済みません。
該当のURLはこちらです。

ttp://p2.chbox.jp/read.php?url=ttp://love6.2ch.net/test/read.cgi/aasaloon/1197207826/all
元のアドレスはこちらです。
ttp://love6.2ch.net/test/read.cgi/aasaloon/1197207826/
エラー内容は 「1行が長すぎるか、正規表現が正しくないようです」 とでます。

496 :名無しさん@勉強中 ★ :08/02/18 19:36:29 ID:???
>>495
確かにsnapshotのdat変換ページのものでは出来ないですね。
何でだろ

配布版p2の最近のバージョンを見てみたですが
本文に到達するまでにJavaScriptやmetaタグその他が
んもうズラーっと200行くらいあるですね。

何かここまで長大な行となると
htmltodatの前処理で取り払うよりも
「○行目から○行目まではスルーする」
みたいなオプションがあったらいいなと思ったですが
どんなもんでしょうか(って誰に言ってるのよ)



それはそうと
自分で使ってたものだと変換出来てたので次レスにて。
もしyykakikoに書けなかったら したらばにでも書きますか。

497 :名無しさん@勉強中 ★ :08/02/18 19:48:16 ID:???
メモ
snapshotのdat化について

URL例
http://p2.chbox.jp/read.php?url=http://love6.2ch.net/test/read.cgi/aasaloon/1197207826/all


正規表現
m#<dt.*?>([0-9]+).+?(?:"mailto:\.?(.+?)">)?<b>(.*)</b>.*?:(.*?)</dt>.*<dd> ?(.*)<br><br></dd>#mik

前処理
s#\n(?:\t| +).+?\n##ig
s#\n<div.+?\n##ig
s#(<a )target=_top (href=)#$1$2#ig
s#(</a> )\[<a href="subject\.php\?host=.+?target="subject">板をp2で開く</a>\] #$1#ig
s#<title.*?>(.*?)/(.*?)</title>#<title>$2</title>#
s#\(<a href="read.php\?bbs=([^:]+?)ID:([^<]+?)(</a>(?:\(\d+\))?)#ID:$2#g
s#(\(p\))(h?ttp://)#$2#ig
s#(<><>)(.*?)( :)#<>$2<>#ig
s#\(<a href="http://be.2ch.net/test/p.php\?i=(\d+)&u=(.+?)\?(\#*)</a> *?</dt>#BE:$1-$3</dt>#g
s#<dd id=.*?\n##ig
s#</i></dd>##ig
s#<b>(.*?) </b>(.*):(.*?) :#<a href=\"mailto:$3\"><b>$1</b></a> :#ig
s#\(<a(.+?)\">p</a>\)##ig
s#<b>(.*?) </b>#<b>$1</b>#g
s#<a href="read.php\?host=.+?>(\d+)</a>#$1#ig


過度のレスアンカーやURLがある所とかだと
これでは対処できないかも。

498 :名無しさん@勉強中 :08/02/18 20:19:59 ID:dQ5deoi1
>>496-497
おかげさまで変換できました。
ありがとうございました。

499 :名無しさん@勉強中 ★ :08/02/19 19:14:00 ID:???
>>498
良かったです

でも何でマッチしなくなったのだろう。
調べるのも大変そうだ

ちなみにこれって
配布版p2スクリプトのhtmlをdat化する奴だもんで
p2.chbox.jpのhtmlであてはめても無意味な前処理も含まれてるですが
まあ動けばいいかなと。

これやってて思ったのは(って大分前ですが)
配布版p2では<a target=_top href=〜>というふうに記述される仕様になってるみたいで
このタグがhtmltodatでは自動削除してくれないみたいな事で。
というか
タグの書き方にも色んなバリエーションがあるんだなと。

500 :名無しさん@勉強中 ★ :08/02/19 19:51:17 ID:???
さて
いちおう
Softbank3G絵文字を最優先表示するようにやってみたです

http://mirror.s151.xrea.com/emoji/test/readsb1.cgi/emoji/1180412107/41

どこ変えたかというと
3つ並べれば分かり易いかも。

http://mirror.s151.xrea.com/emoji/test/read.cgi/emoji/1180412107/41
http://mirror.s151.xrea.com/emoji/test/readsb.cgi/emoji/1180412107/41
http://mirror.s151.xrea.com/emoji/test/readsb.cgi/emoji/1180412107/41

で、問題は
上下にあるページングのリンクなんですが
ここでつまづいております

ページングリンクってのは

「■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 801- 最新50」

これなんですが
「〜/read.cgi/〜」を「〜/readsb.cgi/〜」に変えたいだけなんですが
オブジェクト指向で書かれておるもんで
どこにこのサブルーチンがあるのかさっぱりわかんないのです
こういうのってどこに書いても「自分でやれ」と言われそうですし
さあ困った。

0chスクリプトのread.cgiやbbs.cgiやvalda.plその他あちこちにある
例えば

$Sys->{'SYS'}

の「$Sys」って どのモジュールで行われているのでしょう?

501 :名無しさん@勉強中 ★ :08/02/20 20:29:02 ID:???
中国2chさんリニューアルしちゃった

http://cn2ch.cn/

Flashbbsスクリプトもお隠しになられたみたいで残念
JaneNidaで読み込んであるdatをどこかにバックアップしてみるかな


でもフェードアウトよりは全然いいですし
網頁空間的輪から別の網頁空間へと飛ぶと
うおおこんなに日本関係のもろもろの網頁空間があるのかと驚愕するです
国コードはcnで簡体字フォントを使っているですし
北京や広州とかみたいな地名が出てくるので間違いなく大陸中国のサイトだ
cn2chを見た時もそうでしたが
今回もかなり認識を改めたですよ




伊?美咲中文网BBS MISAKI,伊?美咲,bbs,??男,危?的姐姐,恋???,山女壁女,?迪生之母 - Powered by Discuz!
http://www.misaki-ito.com.cn/bbs2/index.php
广州源子文化?漫特区
http://www.yz.gz.cn/
_ANGEL DREAM_?? - [bbs.lmyangel.com] 制?┃素材┃?尚┃動漫┃音樂┃文字┃下載 - Powered by Discuz!
http://bbs.lmyangel.com/
RE-公式HP
http://yui.huming.com/RE/mine.htm
kkryuのもーそースペース
http://www.voiceblog.jp/kkryu/

502 :名無しさん@勉強中 ★ :08/02/21 07:20:53 ID:???
datとsubject.txtがあれば
わざわざdat2html等でhtml化せずともバックアップ出来そうですね。

http://mirror.sarashi.com/cn2ch/test/read.html/Otaku/1199585507/

香港版や韓国版geocitiesに上げようかなとやってみたら
拡張子datのファイルはブロックされてるですね
日本版のほうはOKなのになー。

503 :名無しさん@勉強中 :08/02/21 14:05:15 ID:PHFkj0Vj
>>500
> 0chスクリプトのread.cgiやbbs.cgiやvalda.plその他あちこちにある
> 例えば
>
> $Sys->{'SYS'}
$Sysには何かのオブジェクトが入っていると推測されます、それを調べるのはref関数を使います。
「ref $Sys」とすると、$Sysが何のオブジェクトのインスタンスなのかがクラス名が返されます。
ですから、「print ref $Sys;」とすると、何のオブジェクトのインスタンスなのか判るでしょう。

「print ref $Sys;」しないでも調べるためには、ソースを頑張ってたどって、コンストラクタが
呼ばれるところを探すしかありません。

と思っていまたどってみました。
read.cgiのPrintReadHeadサブルーチン内の$Sysをたどります。
すぐ上でmy($Sys,$Page)=@_;とあるので、サブルーチンの第一引数です。
PrintReadHeadサブルーチンを呼ぶのは、ReadCGIサブルーチンです。
PrintReadHead(\%SYS,$Page);とあるので、目的の$Sysはハッシュ%SYSのリファレンスです。
サブルーチンの定義のはじめに、my(%SYS,$Page,$err);とあるので、この時点では%SYSは空です。
Initializeサブルーチンにリファレンスが渡されていますので、Initializeサブルーチンの定義を調べます。
Initializeサブルーチンでは、先の%SYSのリファレンスは$pSYSに格納されるようです。
そのあと、%$pSYS = ('SYS'=> $oSYS,(中略) );とあるので、ここで、目的の$Sysはハッシュリファレンスであり、
その定義はInitializeサブルーチンでされている、と判明しました。

この場合、$Sysはオブジェクトのインスタンスではなく、ハッシュのリファレンスでした。
このようなときに「print ref $Sys;」を実行すると、「HASH」と出力されます。

504 :名無しさん@勉強中 ★ :08/02/21 21:44:20 ID:???
>>503
御丁寧にありがとうございます。
ひとつひとつはわからなくても流れを見てわかったような気になったような
・・とりあえずトレース方法は参考になります。

何で$Sysを求めていたかというと、PrintReadMenuサブルーチン中の

$pathMenu = $Sys->{'CONV'}->CreatePath($oSYS,0,$bbs,$key,"$st-$ed");

これで$pathMenuにナンバリングされたスレッドURLが入るところが判らなかったもので。
例えばここだと「http://yy14.kakiko.com/test/read.cgi/mirror/1186175383/1-100」が入るみたいで。

もっぺん書くと

$Sys->{'CONV'}->CreatePath($oSYS,0,$bbs,$key,"$st-$ed");

これのCreatePathサブルーチン(?)ってどこで行われているのだろう・・・。
適当な箇所で
$Page->Print(ref CreatePath);
としても何も表示されないですし。


それはそうと
さあ$Sysの復習だ なんちゃって
ごめんなさいごめんなさい



505 :名無しさん@勉強中 :08/02/21 22:17:10 ID:PHFkj0Vj
>>503
> $Sys->{'CONV'}->CreatePath($oSYS,0,$bbs,$key,"$st-$ed");
この場合は、$Sys->{'CONV'}に何が入っているのかを調べて、そのクラスのCreatePathメソッドを
調べることになります。
ちなみに、この場合のCreatePathはメソッドです。サブルーチンではありません。
Perlではサブルーチンもメソッドも定義の仕方は同じような感じですが、
オブジェクト指向用の作られていればメソッドと呼んだほうが良いです。
「$何か->ごにょごにょ();」←この形はメソッドの呼び方です。対して、
「&何か::ごにょごにょ();」または「何か::ごにょごにょ();」または「ごにょごにょ();」←これらはサブルーチンの呼び方です。

> $Page->Print(ref CreatePath);
ref関数の使い方が誤りだと思います。ref関数に渡すべきはインスタンスです。メソッド名を渡しても意味はありません。
「$Page->Print(ref CreatePath);」と書いた場合、perlは仕方なく、CreatePathを文字列、つまり"CreatePath"と解釈するでしょう。
これは何のインスタンスでも、リファレンスでもなく、ただの文字列です。ですから、ref関数は未定義値を返すでしょう。
正しくは「$Page->Print(ref $Sys->{'CONV'}」
また、$PageはTHORINクラスのインスタンスですが、THORINクラスのPrintメソッドはバッファに押し込むだけで
出力はされません。その点は考慮なさっていますか?

また、「$Page->Print(ref CreatePath);」の「CreatePath」のように、文字列をそのまま書くのはPerlの作法としては
推奨されません。シングルクォーテーションまたはダブルクォーテーションで囲むべきです。
なぜなら、perlは「CreatePath」を関数か、サブルーチンか、定数か、どれなのかと考え、どれでもないので
仕方がなく文字列と解釈するからです。また、後からこれを読む人にも同様の疑念を抱かせます。
これらによって、perlや後からこれを読む人も無駄な苦労をするでしょう。
したがって、明らかな文字列なので、明らかに文字列であるとわかるように、引用符でくくることが強く推奨されます。

506 :名無しさん@勉強中 ★ :08/02/22 20:51:25 ID:???
公私共にいろいろあって疲れちゃった
だもんで一回休み

ちなみにこれ 携帯からです
いよいよ携帯ネットデビューσ(^◇^;)。。。

507 :名無しさん@勉強中 ★ :08/02/23 18:27:53 ID:???
・・・よし、何とかなったかも。
泥縄式のツギハギですが。


えーと

他の所ではこんな事恥ずかしくて書けないですが
他ならぬ自分の板で自分の無知を晒すのは
自分が許す範囲でなら全然構わないと思うのです





という事で

>>505さん

ごめんなさい全然判らないですごめんなさいごめんなさい

> また、$PageはTHORINクラスのインスタンスですが、THORINクラスのPrintメソッドはバッファに押し込むだけで
> 出力はされません。その点は考慮なさっていますか?


ごめんなさい全然そこまで考えを行き届かせるレベルにすら達していないです
ごめんなさいごめんなさい

そもそもPerlに触れたのもほぼ2年振りですし
ほんと全然わかんないんです
今回はオブジェクト指向の書式に沿った書き方は棚上げにするです
それらは次の課題という事で。
一朝一夕には出来ない感じです。


ところで


Webでオブジェクト指向プログラミング
http://pc11.2ch.net/test/read.cgi/php/1133489897/342
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
342 名前:nobodyさん[sage] 投稿日:2007/03/28(水) 22:47:10 ID:???
2ch型掲示板を作る時はオブジェクト指向でやったなあ
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


これもしかして
0chスクリプトの作者さんなのかもとか思ったりして。
オブジェクト指向で書かれた2ch型掲示板って
今のところ0chしかわかんないですし
(って突っ込まれるかもですが)

508 :名無しさん@勉強中 ★ :08/02/24 14:20:28 ID:???
という事で更新したです

http://mirror.s151.xrea.com/emoji/


問い合わせがあったスレッドにも書き込んでと

http://pc11.2ch.net/test/read.cgi/php/1127896640/976

これでOKだったらいいですね。
これで駄目だったらどうしましょうか。

509 :名無しさん@勉強中 ★ :08/02/24 14:21:07 ID:???
全くの別件でメール頂いた方もいらっしゃいますが
現実生活がとても忙しい事になってしまっているので
ごめんなさいしばらく停滞するです

510 :名無しさん@勉強中 ★ :08/02/26 23:13:17 ID:???
http://mesimarja.web.fc2.com/boon/html/200802/1203211106.html

懐かしいです

でも >>502をベースにしたほうが良いんじゃないかとか
僭越ながら思ったりしたです
これって株価【1550】 ▲▲▲▲ ◆cZfSunOs.Uさんがお作りになられたものを
使わせて頂いてるですが
.htaccess無しでも文字化けしないようにならないかなとあれこれやって
結局やりかけだったものだったなーと。


って これ↓ですが。

iswebでのテスト
ttp://mirrorhenkan.hp.infoseek.co.jp/cgi-bin/xml/test/read.html#html/1160652610/l50

以前たまたまお話させて頂いた凄い人に試してもらって
IE7対応にしてみたですが。

IE/Mozillaの分岐処理をもう少し詰めていけば
何とかなりそうな感じなんですが。

511 :名無しさん@停滞中 ★ :08/03/01 19:45:22 ID:???
http://pc11.2ch.net/test/read.cgi/php/1127896640/976-978n

自分の環境では
IEでもMozillaでも問題なくDL解凍アップ出来るのですが・・・。
2.6メガのzipで解凍したら3.6メガくらいになり
確かに解凍にえらく時間がかかったですが何の問題もなかったです

何よりも
要望をお出しになった方からの反応が無いので何とも。


というような程度の事でも
上記スレに書いて
また「ウザイ氏ね」
とか言われてもへこむだけでしょうし

512 :名無しさん@停滞中 ★ :08/03/01 20:13:04 ID:???
http://society6.2ch.net/test/read.cgi/gline/1165245437/547

とりあえず更新しましたけど
情報が少な過ぎるです

「変換できなくなっていました」だけでは手も足も出ないです
せめて該当スレッドなりミラーURLなり出して頂かない事には


しかし通信状態を逐一見ながらやってみると
2ch-imode.wsfって ほんと
作ってごめんなさいな感じのスクリプトですね・・・
本当にごめんなさい

513 :名無しさん@停滞中 ★ :08/03/01 20:57:58 ID:???
>>510ですが、今改めて見てみると
IEでは問題ないのですが
Mozillaではレス1だけしか表示されないですね。
少なくともBagelでは。

IEとMozillaって
改行コードの取得方法とかも違ってるのかな。
スクリプトをよく見てないですが、改行コードが
「Cr+Lf」「Cr」「Lf」のどれでもOKになるように書き換えればいいのかな。
あとスレタイ表示とレスアンカーポップアップと。

514 :名無しさん@停滞中 ★ :08/03/01 21:27:20 ID:???
追記
>>510の最初のほうです


>>510の後のほうを使わせて頂いて
dat2html-7を設置してみようかな

515 :名無しさん@停滞中 ★ :08/03/02 13:13:15 ID:???
メモ
讃岐メニュー(http://s.s2ch.net/)のdat化について

URL例(そのうち消えると思いますが)
http://s.s2ch.net/test/---.uaY!FROM=&mail=&color=000000+efefef+0000FF+0000FF+FFFFFF&size=3&NG_NAME=&NG_MAIL=&NG_DATE=&NG_MESSAGE=/mamono.2ch.net/morningcoffee/1204168214/1-1001

正規表現
m#(?:<form action=i>|<br><br>)([0-9]+):<font color=.+?><b> ?(.+?) </b></font>(?::([^/]+?))?:(.+?)(?: |\(\d+\))?<br>(.+?)(<br><br>)#mik

前処理
s#<a href="http://be\.2ch\.net/test/p\.php\?i=(\d+).+?</a>(.+?)(<br>)#BE:$1-$2 $3#ig

変換結果式
メール欄逆転

後処理
s#(\n[^<]*?)<a.+?>(\d+)</a>#$1$2#igk



以前のものでは出来なくなっていましたので。
変更点は、正規表現部分の
「<font color=forestgreen>」を「<font color=.+?>」にしたです。

ちなみにこの箇所、讃岐メニューでは
「<font color="#228B22">」と数値に変更なさっておられるみたい。

516 :名無しさん@停滞中 ★ :08/03/02 16:06:04 ID:???
>>513の件
調べてみると なかなか厄介そうだ

改行の研究
http://www.umechando.com/tips/35.htm

これのテストをしてみると
IEだと22
Bagelだと21
になるですし
ブラウザ上にdatを表示させてソース表示させるブックマークレットを通すと
IEとBagelで全然違う表示になるみたいですし。

xmlhttpの場合は問題無いみたいなんですが
そっちだと文字化けの問題がありますし
さあどうしよう

517 :昼休み@@名無しさん@停滞中 ★ :08/03/04 12:23:33 ID:???
http://society6.2ch.net/test/read.cgi/gline/1193462528/336
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
【2】:スレッドのURL(1日2スレ以内)
http://anime.2ch.net/test/read.cgi/anichara2/1158025093/

その28で1001まであったので取得し、htmltodatで変換すると
「1行が長すぎるか、正規表現が正しくないようです」とエラーが出ます
正規表現はhttp://yy14.kakiko.com/test/read.cgi/mirror/1186175383/430-431nを使っています
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

dat化出来るけどなぁ・・・。
少なくとも「1行が長すぎるか、正規表現が正しくないようです」というエラーは出なかったです。
まあ上の場合は
レス71/80/126の3箇所で長文略がありますが。

もしかしたらOSやwshのバージョンの違いによって
返ってくるタグが変わってくるのかな。
少なくとも日本語OSでないと使えないでしょうし
(↑Shift_Jisがデフォルトだという前提で作ったスクリプトだもんで)


>>511の件といい
最近は、自分がやった事が伝わっているのかどうか
実に不安になるです
自分の説明不足なのかどうなのかが不明ですし。

518 :午後休憩@名無しさん@停滞中 ★ :08/03/04 14:16:01 ID:???
メモ
2ch-i(http://2ch-i.net/)のdat化について

html例
http://mirror.sarashi.com/htmltodat/1158025093.html

正規表現
m#<p>\[([0-9]+):(.+?)(?:≪(.+?)≫)? +\((.+?)\) ?(?:<a href=.+?>AA</a>)?\]<br> ?(.+?)<hr>#mik

前処理
s#(<title.*?): 2ch-i(</title>)#$1$2#k
s#<SCRIPT language="JavaScript">.+?</SCRIPT></body></html>##igk

変換結果式
メール欄逆転

後処理
s#(^|\n.*?)(◆.+?)<>(.*?)<>#$1</b>$2<b><>$3<>#igk
s#(▼)<A NAME=SKP1>(<>\r)#<font color="red">$1長文レスにつき略・・各自で補完して下さい http://www.geoticies.jp/mirrorhenkan/2ch-i/</font>$2#igk
s#</p>(?:<a.+?>)?(<>\r)#$1#igk



これですが、通常の2ch-iのhtmlでも使えますが
http://yy14.kakiko.com/test/read.cgi/mirror/1186175383/430-431n
で未変換行が出る場合だけ使ったほうがいいかも。(まあどちらでもOKですが)

上のhtmlの場合、レス71/80/126の3箇所で長文略になっており
>>430-431の正規表現ではそこをカバー出来ていなかったです。
今回のものなら省略部分は省略部分でdat化させるようにしたのでエラーも出ないかと。


省略部分を補完させたい場合は
dat化させたものを専用ブラウザで開いて
例えば「▼長文レスにつき略」でレス抽出すれば、省略レスの番号がわかります。
あとはその部分を差し替えれば良いのかなと。

上の場合、元URLが
http://anime.2ch.net/test/read.cgi/anichara2/1158025093/
で、
省略レスが71/80/126の3箇所あるので

http://2ch-i.net/&/anime.2ch.net/anichara2/1158025093/71-71.ni
http://2ch-i.net/&/anime.2ch.net/anichara2/1158025093/80-80.ni
http://2ch-i.net/&/anime.2ch.net/anichara2/1158025093/126-126.ni

をそれぞれ呼び出してdat化させて
該当行を各々差し替えれば良いと思うです

519 :名無しさん@停滞中 ★ :08/03/05 18:26:40 ID:???
名前欄のように停滞中ですが
過酷な現実から目を背ける為に
まあ息抜き程度に


さて
またJavaScriptでdat2htmlでもやんべかと色々見てみたら
DOMって面白おすなあ

<script type="text/javascript">
<!--
function func() {
var oImg = document.createElement('img');
oImg.setAttribute("src", "xxx.gif");
var oDiv = document.getElementById("id123");
oDiv.appendChild(oImg);

var text = document.createTextNode('テスト');
oDiv.appendChild(text);

}
// -->
</script>
<div id="id123"></div>
<input type="button" value="OK" onclick="func()">



何したいかというと
容量が多いdatをJavaScriptでhtml表示する際に
今のものだと全部処理するまで表示されないものを
処理されたものをリアルタイムに反映してみたいなと。

こういうのって本家に立派なものがありますけど
まあいいじゃないかと

520 :名無しさん@停滞中 ★ :08/03/06 18:23:11 ID:???
appendChild
http://tomizawa-web.hp.infoseek.co.jp/method/appendChild.htm

521 :名無しさん@停滞中 ★ :08/03/06 18:57:46 ID:???
上のスクリプトのポイントはこれっぽい
createTextNode()よりこっちのほうが良さそう

function fAppendChild() {
var oOl = document.getElementById('oOl');
var oLi = document.createElement('li');
oLi.innerHTML = 'LIオブジェクトを追加しました。'
; oOl.appendChild(oLi);
changeDisabled();
}

522 :名無しさん@停滞中 ★ :08/03/07 18:14:45 ID:???
http://pc11.2ch.net/test/read.cgi/php/1127896640/976-979n

これ見て
またまたDL解凍アップして
私の環境では何の問題も無かったんですけど
どうしたもんでしょうか。
他の方々も駄目なのかな

再アップしようにも2.5メガのzipだもんで
おいそれと置く場所が見当たらんのですが。
geocities.jpに置いたってーのは
例えば6年前(!)のmp3ファイルがまだ現役だったのでそこにしたですけど。
下記

http://academy4.2ch.net/test/read.cgi/gogaku/968412567/288


いっその事
sourceforge.jpとかvectorに
スペースを申し込んでみようかな
断られるかな

523 :名無しさん@停滞中 ★ :08/03/07 19:04:03 ID:???
ちょっとカッとなったのでリンクしたです
今さら直そうにも
さてどこをどういじったのやら

0chスクリプトread.html化(.htaccess不使用版)
http://mirrorhenkan.hp.infoseek.co.jp/0ch_html/

文字コードShift_Jisのdatをxmlhttpで呼び出し整形表示するようなものって
あんまり見ないんじゃないかなと。
検索すると、webのあちこちで
「文字コードUTF-8じゃないと文字化けすんだぜ 素人はこれだから困る」
とかいうのを目にするですが
(例えばhttp://pc11.2ch.net/test/read.cgi/hp/1127340053/300-301n
色々調べるとそんな事もないようで。

で、上のスクリプト、IEだと変則的になるですが
今さら直そうにも さてどこをどういじったものやら。
あちこちのステータスコード確認の箇所を全部分岐処理すればいいんでしょうけど
んもー かったるいなー

524 :名無しさん@停滞中 ★ :08/03/07 21:14:51 ID:???
さて
tatsuさんのdat2htmlでの
レスアンカーポップアップのJavaScriptってどうやってるのかと
サイトに行ってみたら

DAT2HTML等サポート掲示板
http://tcup7109.at.infoseek.co.jp/tatsu01/bbs
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
テスト版リリース 投稿者:tatsu  投稿日:11月 8日(木)23時34分2秒

 Ver.0.34bのリリースからかなり間が空きましたが、新機能の検討と追加は地道に行っています。
 とりあえず、テスト版を公開してみます。

  0.34c test071108

 (中略)

 ・0ch for world2ch
 http://mirror.s151.xrea.com/0ch_utf8/のログに対応

※テスト版のため予期せぬ不具合が発生する場合があります。
http://tatsu01.sakura.ne.jp/dat2html034c_test071108.lzh (672KB)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


こんな僻地のものまでチェックされてたんですか。
というか world2chやtaiwan2chに対応されておられたので
自分とこのものも大丈夫なんじゃないかと思ってたですが。

ところで dat2htmlの次回追加機能としては
絵文字の画像リンク変換なんてのはどうでしょうか。
それなりに(UTF-8のくらいには)需要はあるかと思いますが。



全然関係ない別件ですが
Faceちゃんねるのスパム投稿がやたら多くて
管理人さんのレス削除が大変そうなので
何となく書いてみたです

http://justcallmeai.com/board/test/read.cgi/fch/1169914242/215

自分とこの配布サイトもreadmeも管理画面も日本語オンリーだったので
0ch-UTF8スクリプトを設置運用されているFaceちゃんねる管理人さんなら
日本語投稿でも問題ないだろうなと

525 :名無しさん@停滞中 ★ :08/03/08 20:35:50 ID:???
http://pc11.2ch.net/test/read.cgi/software/1201790889/253-258n

ちょっと試しにいろいろやってみたですが
少し後悔しております

http://mirror.s151.xrea.com/2ch/0chu/test/read.cgi/utf8/1141982526/45

526 :名無しさん@停滞中 ★ :08/03/09 19:28:13 ID:???
http://society6.2ch.net/test/read.cgi/gline/1193462528/370-371,374-375

これですが

http://mamono.2ch.net/test/read.html/newsplus/1197541637/

上のdatファイルは

http://mamono.2ch.net/newsplus/dat/1197541637.dat

で表示されます
IE6だとxml表示されますが、まあわかるかなと。
これの該当行をコピペすればいいかと思うです

気力が湧いたらこのdatリンクと説明も追加しますか。
今やったら泥沼に入り込みそうなので。


てか皆さん親切だなー。
dat化方法も「こんな説明でわかるのかな」と半信半疑でやってるですが
結構自力でdat化されておられるみたいで。
まだまだ世の中 捨てたもんじゃない感じですね。
絶望するには程遠い。(と思いたい)

失礼しました

527 :名無しさん@停滞中 ★ :08/03/10 17:26:19 ID:???
http://www.openspc2.org/reibun/javascript/window/006/

<html> <head>
<title>ウィンドウポップアップを表示する</title>
<script Language="JavaScript"><!--
function showPopup() {
wOBJ = window.createPopup(); popOBJ = wOBJ.document.body;
popOBJ.style.border = "solid blue 2px"; popOBJ.innerHTML = "サンプル"; wOBJ.show(-100,80,320,32,document.body);
}
function hidePopup(){
//どうすりゃいいのよ
}
// --></script>
</head> <body>
<a href="javaScript:showPopup()" onmouseover="showPopup()" onmouseout="hidePopup()">ポップアップを表示</a>
</body> </html>

528 :名無しさん@停滞中 ★ :08/03/10 18:51:28 ID:???
http://justcallmeai.com/board/test/read.cgi/fch/1169914242/184-185n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
184 名前:Pr[] 投稿日:2008/03/10(月) 01:52:30
 久しぶりに来たがすっげーガクブル -_-;;;;

 NGワードはこの前設定したんだけど何かうまくできないようですね。もうちょっと追加しました

 ところで中国語...って一体-;;;;

 Googleでヒットしなくする方法はないんですか OTL


185 名前:Pr[] 投稿日:2008/03/10(月) 01:56:44
 そして跡がとても汚なくて押し堅めました
 おかげでこのスレは番号が台無しだからリンクがまともに出ないです
 御了承ください黒
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−



書いちゃった(^^;)

http://justcallmeai.com/board/test/read.cgi/fch/1169914242/186

529 :名無しさん@停滞中 ★ :08/03/10 19:06:41 ID:???
http://takatyan.ddo.jp/test/read.cgi/main/1192376543/59-62n

このやりとりを見て試してみたら
23ch.infoさんって 携帯にも対応されておられるみたいですね。

携帯端末から

http://www.23ch.info/

に接続すると、ステータス302を返して

http://mobile.23ch.info/

にリダイレクトしたです。

同様に

http://www.23ch.info/test/read.cgi/gline/1165245437/

に携帯からアクセスすると

http://mobile.23ch.info/test/read.cgi/gline/1165245437/

に繋がって読めるみたい
携帯用変換機にも追加するですか



しかし、携帯のパケット料金ってすごいですね。。
少しだけやっただけなのに、今朝見たら700円くらい使っちゃったみたいで。
W定額ライトというものに入ってるみたいなんで、上限4千円だそうだけど
んもう 携帯のネットは怖いです
4千円あったら他の事に使いたいですよ

530 :名無しさん@停滞中 ★ :08/03/12 07:19:23 ID:???
メモ

ユーザからの一行入力 - 獨習Python - pythonグループ
http://python.g.hatena.ne.jp/mhrs/20060519/p15

このメソッドがあれば
wshと同等のことがpythonでも出来そうだ
MacやLinuxの標準機能だけでdat化やdat2htmlとかに使えそうだなと
って ほとんどの人には関係なさそうだけど

531 :名無しさん@停滞中 ★ :08/03/13 19:38:00 ID:???
メモ
復活おめでとうです

台湾2ch
http://hinasakura02.xxking.com/mini02/

まだあちこち維修中みたいですが
とりあえずJaneNidaで文字コードBig5に設定して
subject.txtを読み込んでみたら文字化けしなかったです

あとはread.cgiの全部表示の方法かな。
abcorotiや米tripodや使えるネットみたいにpath_info表示出来ないサーバなのかもで
read.cgi?bbs=***&key=*****
でやってみてもうまくいかなかったです。
Flashcgiスクリプトのread.cgiを見てみてもよくわかんないですし。
スレッド表示方法が判れば、それをdat化取得すればいいだけなんですが。

それにしても
まだJaneNidaのリンクがトップにあるんですが
ならばdatを閲覧開放して欲しくあるです

532 :名無しさん@停滞中 ★ :08/03/13 19:54:17 ID:???
ところで
問い合わせさせて頂いたものに御返事頂いたのですが
それに対する御返事をするには込み入った事を解きほぐさなければならず
今の自分には少し難しいので
ぐああ困った

533 :名無しさん@停滞中 ★ :08/03/16 18:02:45 ID:???
FlachCGIのスクリプトを見てみたんですが
path_info表示出来ないサーバでは
スクリプト側でread.cgiの隣に「?」を付けるようになってるみたい

例えば

http://hinasakura02.xxking.com/mini02/qa/

の一番上

http://hinasakura02.xxking.com/mini02/test/read.cgi/qa/1141313329/

↑この場合は

http://hinasakura02.xxking.com/mini02/test/read.cgi?/qa/1141313329/

となるみたい。
でもエラーになるです

今年の3月10日の書き込み(というかスパム)があるので
その辺りまでは読み書き出来たのでしょうけど
管理人さんが意図的に止められたのかな。
http://hinasakura02.xxking.com/mini02/janetw%5B1%5D.png
みたいに読めれば面白いんですが。



あとオカルティカレーマニアさんの所も
スパムが出始めたですか

http://occultycurrymania.myhome.cx/bbs/index2.html

534 :名無しさん@停滞中 ★ :08/03/16 18:41:53 ID:???
何となくdat2htmlの車輪の再発明をしてますが

http://www.geocities.jp/mirrorhenkan/dat2html-9/html/dat/read-pop.html?key=1159620853
http://www.geocities.jp/mirrorhenkan1/dat2html-7/test/read.html#dat2html7/1002458845

上はIE6やMozilla/OperaではOKですがIE7では文字化けするそう
下はNetScape4やNetScape7で駄目との事

NetScape9ではOKだそうなのでNN7等はあきらめよう
IE7対応は検討する箇所の見当がついてるので余裕が出来たら健闘しよう
あと>>519-521
いやー面白いなー

535 :名無しさん@停滞中 ★ :08/03/18 19:25:00 ID:???
自分とこが載ったです

[IronPython].Net Frameworkメソッド呼び出し urllibの代替
http://blogs.wankuma.com/mutaguchi/archive/2008/03/17/128160.aspx

Microsoft MVPの方のブログなので
これで少しは箔が付くかな(って全然つかないと思いますよ)


またpython勉強し直そうかな

536 :名無しさん@停滞中 ★ :08/03/19 19:50:09 ID:???
縁あって技術的な事をお伺いさせて頂いていたのですが
IronPythonもおやりになられているとの事なので
>>279のスクリプトが使えるかどうか訊いたのでした
自分以外 誰も試してないので。
で、そのものズバリのスクリプトが無かったので試行錯誤した件をお話したら
URLを出して下さったという訳で。
これで少しは際物扱いもされなくなったらいいですね。



−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
IronPython 1.1.1ではurllibが含まれておらず、
Python2.5.2に含まれているライブラリを使うのも互換性の問題で難しいようです。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

pythonスレだと
IronPython使いの方が何の問題もなくurllibをお使いになられているですが。

Pythonのお勉強 Part 24
http://pc11.2ch.net/test/read.cgi/tech/1203611273/700-704n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
700 名前:デフォルトの名無しさん[sage] 投稿日:2008/03/16(日) 23:48:22
どなたか教えてください
t=urllib.urlopen("http://〜〜").read()
print type(t)
とするとstrとなるんですが。
utf-8のサイトの場合 tの型がunicodeになってほしいんです
どうしたらよいでしょうか。
python2.5の場合はstrのままテキストに落としたらutf-8として文字化けせずに表示されるのですが
ironpythonの場合テキストエディタで開いたらASCIIとして認識され文字化けされています。
utf-8としてそのファイルを保存し直しても文字化けしたままです。
解決策ご存じの方いましたらお願いします

701 名前:デフォルトの名無しさん[sage] 投稿日:2008/03/16(日) 23:52:27
t=urllib.urlopen("http://〜〜").read().decode("utf-8")

703 名前:700[sage] 投稿日:2008/03/17(月) 00:39:43
文字化けしない方法自己解決しました。すいません;
ファイルの側をバイナリモードで開いて突っ込むだけでした。
open("hoge","wb")

704 名前:700[sage] 投稿日:2008/03/17(月) 02:02:00
>>701
ちゃんとレスが表示されてなくて見てませんでした。

それだとAsciiキャラクタじゃないから変換できませんよーってエラーがでます。
ironpythonではutf-8なんて定義されてないって出ました
僕の環境だけでしょうか・・・・?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


って別にどうこういう訳ではなく疑問に思ったもので。
まさしく「ソースは2ch」なのでブログにこの件出すのも何だしなーと。

537 :名無しさん@停滞中 ★ :08/03/19 20:00:03 ID:???
読み直してみると
上の700さんはpython2.5とIronPythonの両方とも入れておられるみたいですね。
という事は urllibのパスも通してあるのかもしれないです

おまけ
ついさっきの書き込みみたい

http://pc11.2ch.net/test/read.cgi/tech/1203611273/768
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
768 名前:デフォルトの名無しさん[] 投稿日:2008/03/19(水) 19:43:08
人間の頭なんて大差ないんだよ。
やるか、やらないか、それだけの違い。
毎日少しずつでも前進してる奴と、
毎日言い訳を考えて何もしない奴とでは差がついて当然。

たいしたことを思いつこうが、思いつくまいがそんなのどうでもいい。
出来ない奴を馬鹿にする奴はどうせたいした事無いから。
出来ない奴に対して自慢したいだけなんだよ。

やりたい事、目標を見つけて少しでも前進する事。
覚える事がさしあたって100あるなら1つずつ覚えていけばいいだけじゃないか。
一度に100覚えられないから漏れは駄目なんだと思ってるんじゃないのか?
それは天才がやる事であって、凡人は1つずつやっていけば良いんだよ。
努力する癖を習得するんだ。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


読んでみて
ああ色々と恥ずかしい・・・
って 自分のていたらくがですが

538 :名無しさん@停滞中 ★ :08/03/19 20:27:59 ID:???
http://society6.2ch.net/test/read.cgi/gline/1165245437/550

書ーいちゃった
書いちゃった

ごめんなさい

539 :名無しさん@停滞中 ★ :08/03/20 10:06:34 ID:???
http://society6.2ch.net/test/read.cgi/gline/1165245437/551

また「ウザい氏ね」みたいな反応だけかもしれないなー
一介のまとめ人さんに試して貰うよう連絡させて頂こうかしら

てかほんと素人なので
すごい人に訊くのが怖いんですよ。
「そーんな事もわかんないのかいボク」みたいな事とか言われそうで

540 :名無しさん@停滞中 ★ :08/03/20 12:12:03 ID:???
さて次は
pythonでdat2htmlでもやってみますか。
python版html2datを参考にすれば
そんなに難しくもなさそうです

というか
python版html2datを出されているnanabit.netさん
何故python版dat2htmlをお出しになっておられないのでしょう
フォーマットが決まっている分 ずっと難易度が低いと思うんですが

541 :名無しさん@停滞中 ★ :08/03/20 15:40:19 ID:???
>>538-539ですが
御返事を頂けたら頂いたでまた大変だなーと。
府知事に立候補して開票1秒で当選した橋下知事の如くで
当選したらしたで 府政その他であれこれやんないといけないんで。

それはそうと

HTML2DAT @ 7bit
http://nanabit.net/softwares/html2dat.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
使用規約・ソースの取り扱い

  * フリーウェア。
  * アーカイブの内容を改変しない場合は、使用、譲渡は自由。
  * アーカイブの内容を改変する場合は、改変した旨表示すること。
  * ソースの流用は自由(著作権表示の必要なし)。

常にreadme最新版を優先
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−



>  * アーカイブの内容を改変する場合は、改変した旨表示すること。

>>337のって アウトかな セーフかな・・・
readmeをつけるか ソースに追記したほうがいいのかな

542 :名無しさん@停滞中 ★ :08/03/20 18:02:59 ID:???
ソースに追記したものと差し替えたです

ところでpythonって
テキストファイルだけでなく
バイナリファイルも扱えるみたいですね。
wshとは大違いだ(って優劣を言ってるみたいで何ですが)

あと>>535の方のお話だと
wshだとUTF-8のテキストファイルを扱えないとの事で
あーだからhtmltodat_for_cn2ch.wsfを作る時にひどく悩んだ訳だと納得したですが
これもpythonでは無問題。
だから簡単にhtml2dat.pyをUTF-8版に出来たんですが。

当方 .Net Framework や PowerShell はおろか ADODB.Streamも使えない環境なので
UTF-8のファイルを正規表現加工させるのもwshでやるしかなかったんですが
これって もしかして変態のやる事だったのかな。
やったところで「ふーんだから何」程度のものですが。

で 結局何書きたかったのかな>自分

543 :名無しさん@停滞中 ★ :08/03/21 19:08:03 ID:???
●公開
http://namidame.2ch.net/test/read.cgi/news/1205977810/

さて
Fox★さん公認の お試し●アカウントが昨晩ありましたので
久しぶりに●ログイン取得するwshをやってみたです
まだいろいろやりかけですが ついさっきお試しアカウントが使えなくなったので出しとこう

http://www.geocities.jp/mirrorhenkan/others/maru/maru4.wsf.txt

何とかうまくいったっぽい。ただ問題がひとつ。

●のID/Passでログインして戻り値取得まではうまくいってるみたいです。
で、その戻り値をもとにofflaw.cgiにアクセスしてdatを取得するのですが
送信ヘッダに「Accept-Encoding: gzip,deflate」を付けなければdat取得出来ないのです。
自分の9x環境ではwshだけではどうしても付けられませんでした。
ちなみにproxomitronで強制的にヘッダをつけたら出来たです。(gz圧縮ファイルでしたが)

このヘッダ送信が出来ない件が
自分のレガシー環境に起因しているのか はたまたコードがまずいのか
どうも判然としない。
以前、maru2.vbsの件でメール頂いたのですが
それによると3回に1回は取得成功出来ていたそうなので
新旧OSによる違いがあるのかもしれない。
でも自分独りでは検証しようもないです。
●持ちの方、もし宜しかったら試して頂けませんでしょうか。

もしこれで他のwindows環境でもうまくいかなかった場合でも
ログインは成功しているようなので、その場合は別の方法を考えてます。
(時間があったらHTAでも作れば何とかなりそうですがちょっと余裕がないけど)


今回のものは公認のお試し●アカウントでやったものなので
まあ問題はないかなと。
delphi/php/perlで作られたスクリプトはありますが(あと「=2ch」はVBAですか)
wshで作ったものはまだ公になったものはなさそうなので
面白そうだなと思ってやってみただけです。
windows標準の機能だけでも●ログイン取得出来たらいいなあという事で。

544 :名無しさん@勉強中 :08/03/21 19:40:36 ID:II86Gs0B
>>543
お試し再開ktkr
qb5.2ch.net/test/read.cgi/operate/1206071602/83

545 :名無しさん@停滞中 ★ :08/03/21 19:58:14 ID:???
>>544
おおどうもです
教えて頂かなければ知りませんでした

いっちょ =2ch の●ログイン方法を見てみますか。

ただこのExcelマクロ
Excel97では使えない関数を使っておられるので(確かsplit関係)
自分とこでは使えないんだよなー。


Excel総合相談所 47
http://usamimi.info/~mirrorhenkan/2ch/excel/read.php/1152852610/905-911n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
905 901 [ 2006/08/16(水) 22:27:24 ]
>>890
97はSplitはだめなのか
ちなみに月と日が一桁の場合は
2004.1.1となる?2004.01.01となる?


906 890 [ 2006/08/16(水) 22:29:28 ]
>>905
すみません
>>903
97はSplitがありませんでした。
月日は2004.1.1となります。


911 名無しさん@そうだ選挙にいこう [ 2006/08/16(水) 22:46:17 ]
>>906
97用split

http://kasamatusan.sakura.ne.jp/cgi-bin2/src/ichi48613.txt.h...
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

546 :名無しさん@停滞中 ★ :08/03/21 20:13:05 ID:???
再度お試し●もせいぜい1〜2日くらいでしょうから
ちょっとスクリプト試すには時間が無いなー
今日は疲れちゃったし

547 :名無しさん@停滞中 ★ :08/03/22 08:51:30 ID:???
有効期限は次の日銀総裁が決まるまでですか。
て事は土日はいちおう大丈夫なのかな


お試し●が使えるうちに修正したものを出しとくです

http://www.geocities.jp/mirrorhenkan/others/maru/maru5.wsf.txt

DLして拡張子wsfにして●ID/Passを入力して実行すればいいと思うです。
DLされたdatを開いて「-ERR もう使えません」とあったら失敗ですが
その場合、実行途中で●dat取得用URLのダイアログが出たものをコピペしておいて
User-Agent: Monazillaを指定できるツールでDLしてみて下さい。
身近なものだと(この板的にですが)
htmltodatの 受信オプション→HTTPヘッダの追加で

User-Agent: Monazilla/1.00(mirrorhenkan/20080322)

とか指定してURLを呼び出せば出来ると思うです。

548 :名無しさん@停滞中 ★ :08/03/22 12:10:16 ID:???
上の奴
Vistaで2回試して2回ともいけたと連絡頂いたので
どうやらこれで良いようです。
あー良かった

ちなみに
+OK 362400/1024K Location:temp/
というのがdatの1行目に入ってるそうですが
取得出来ているみたいだから修正も簡単だろうなと。

Meでは駄目だったそうなので(98SEはwshバージョンが2.0なので検証不能との事)
やはり9x/MeとNTの違いがここにあるのかもですね。


んじゃ
ページを作ってリンクさせておきますか。

549 :名無しさん@停滞中 ★ :08/03/22 15:24:29 ID:???
http://www.keydb.info/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
お知らせ
管理する時間的余裕が無くなってきた為このサイトは閉鎖します。
週明けまでは残しておきますので必要な方は使ってください。今までありがとうございました。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

そういえばshutdown.jpさんも404ですね
逆にデスクトップ2chさんの所は復活しているです

リンクを辿ってみると、デスクトップ2chの管理人さんって
megabbsや苺chのスクリプトをお書きになられた方みたい

A-round/2chTypeBBS
http://around.at.infoseek.co.jp/

550 :名無しさん@停滞中 ★ :08/03/22 20:02:02 ID:???
お試し●も使えなくなったですか。
=2chのコードを見たですが書き込み時のログインだけみたいで
dat取得はついてなかったです


で、せっかくなんで出しとこう

●ログイン & dat取得スクリプト by WSH
http://www.geocities.jp/mirrorhenkan/others/maru/

JavaScriptでのトリップ生成スクリプトの下あたりにつけますか。
「意味あんのこれ」という意味では同じカテゴリでしょうし。


誰も何も言わず触れられず無反応でしょうけど
JavaScriptやwshだけでこんな事が出来るんだよという事で

551 :名無しさん@勉強中 :08/03/22 20:23:01 ID:PQIxB/Fp
>>550
また・・・かな?ただ今度は結構難しそう。
qb5.2ch.net/test/read.cgi/operate/1206071602/

552 :名無しさん@勉強中 :08/03/22 20:58:01 ID:PQIxB/Fp
私が使っているPerlスクリプトを一部改変したものを参考のためにおいておきます。
公開する前に自分のIDとパスワードをちゃんと消したか何度も何度も確認しました・・・。

takatyan.ddo.jp/maru_sid.txt

そのうち消すかも。

553 :名無しさん@停滞中 ★ :08/03/23 15:09:36 ID:???
疲れちゃってたのでした

>>551-552
おお貴方でしたか。わざわざどうもです。
スパムさえ無ければURL貼れるようにしたいんですが。

まだ流石に●ログイン関係を覚えていたんで上げて下さったものを見たのですが
そうかperlではそこんとこそうやったりあそこをそうやるのかと。
エンコードを一発で済ませられるのはいいですね。

ただ ActivePerlは入れてますが
LWP::UserAgentとかCrypt::SSLeayを入れてなくて
入れるのも何だか大変そうなので頓挫しました

http://digit.que.ne.jp/work/wiki.cgi?Perl%E3%83%A2%E3%82%B8%E3%83%A5%E3%83%BC%E3%83%AB%2FLWPとか
http://d.hatena.ne.jp/rin_ne/20041127

それにしても、あちこち見てつくづく思うのは
追加モジュールが必要なスクリプトが多いなーと。
標準モジュールのみで出来たら良いのですが。(←スキルが足らない言い訳)
ここらへん突っ込み所かもしれないなとか思いますがまあいいや

お試し●もありがとうです。
FOX★さんの気まぐれ次第でしょうけど
この調子だと 次の日銀総裁が決まるまで続けそうですね。

554 :名無しさん@停滞中 ★ :08/03/23 15:30:55 ID:???
さて次は何やろうかな
お試し●がいつ使えなくなるのかわかんないんで
maru.wsfのバグ取りも何だか億劫だし
そもそもバグ取りしてもあまり意味あるものでもないですし

maru.pyやmaru.xlsをやってみようかなとか一瞬思ったけど
pythonやExcelVBAまだよく判んないんで
勉強しているうちに時間切れだろうし
そもそも意味あんのかおいコラ(逆ギレ)


何というか
知らないことが多すぎて これからの人生面白そうだぜ。

555 :名無しさん@停滞中 ★ :08/03/23 16:29:47 ID:???
と書いて少し反省

maru.wsfのバグ取りですが
3つほどあるかな

(1)取得したdatの一行目を削除
(2)9x/Me と NT の判別処理
(3)ダウンロードしたdatが「-ERR もう使えません」or「-ERR 使用時間が過ぎました」
 の際の処理

(1)(3)はまあ難しくなさそう。

問題は(2)で
UAから判別は出来なさそう(ってか自分自身のUAってどう判断されるんでしょ)
Kernelのバージョンから調べるしかないのかな?
何か大変そうだ


あと、Meでは●ID/Passが正しいのにログイン出来ないと連絡頂いたですが
そうなのかな

556 :名無しさん@停滞中 ★ :08/03/23 18:23:49 ID:???
pythonでやってますが
urllib2を使えばUser-AgentとAccept-Encode:gzipの二つともヘッダ送信出来ますね。
ただ返ってくるファイルがgzipされてて自動解凍が出来ずにつまづいてます

時間が無いので ここまでかな・・・

557 :名無しさん@停滞中 ★ :08/03/23 18:35:24 ID:???
追記
参考サイト

技術メモBlog: urllib2で、User-agentなどを設定
http://terapyon.blogspot.com/2007/01/urllib2user-agent.html
pythonでHTTPのgzipデータを読み込む
http://blog.kzfmix.com/entry/1187087731

前者はうまくいったんだけど
後者がうまく取り込めないです


上のはセッションID取り込み後のofflaw.cgiでのdat取得の件ですが
その前段階のhttps://2chv.tora3.net/futen.cgiにアクセスして●ログインするのはまだで。
これをやるには
pythonの正規表現のやり方と文字列エンコード方法とSSL通信の方法を理解しなければならなそうです
ひとつひとつ片付ければ何とかなるような気もするなー

まあ遊んでるだけなんで。

558 :名無しさん@停滞中 ★ :08/03/24 19:14:44 ID:???
帰ってみたらお試し●使えなくなってましたか
むむむ
やっと●ログイン戻り値取得のほうもpythonで出来たんですが
ここまでかな・・・



て事で やりかけを出しとこう
自分用バックアップというのがメインだけど

http://www.geocities.jp/mirrorhenkan/python/maru/maruyarikake1.py.txt
http://www.geocities.jp/mirrorhenkan/python/maru/maruyarikake2.py.txt

上が●ログイン戻り値を取得するpythonスクリプト
下が●の戻り値を使ってofflaw.cgi経由でdatを取得するpythonスクリプト


あとは正規表現と文字列結合とエンコード方法を調べて追加修正すれば
一応完成だったんですが。

もう一日欲しかったです

559 :名無しさん@停滞中 ★ :08/03/24 19:32:14 ID:???
ちなみに
http://pc11.2ch.net/test/read.cgi/php/1127896640/976-980n
の件
偉い方にお訊ねしたら

> Noah(unzip32.dll使用)とVistaのエクスプローラで正常に解凍できました

との事なのでもういいかなと。

980さんはRainboardに絵文字変換導入出来たのでしょうか。
出来たとしても再配布不可のスクリプトですが>Rainboard

560 :昼休み@名無しさん@停滞中 ★ :08/03/25 12:33:10 ID:???
メモ
長文コピペごめんなさい


http://www.keydb.info/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
※keydbは閉鎖しました※



突然閉鎖したので混乱した方もいるかもしれません。すみません。

閉鎖の理由は、特に圧力があったとかではありません。
このサイトのスタンスをちょっと書きますと、
権利者からの削除要請はちょくちょくありますが、私は基本的に削除要請には応じてきませんでした。
しかし犯罪の動画(レイプとか)などは要請があれば、公開してはいけない情報だと素人的直感で判断して消してました。
実際の所、法律も詳しくないし判例などの情報も少ないので、どうするのがベストかわかりませんでした。

閉鎖の理由は
・ダウンロードは違法になりそうでリスクを取りたく無い。
・あまり時間が無い中で管理してきましたが、4月からさらに無くなる。
・特に利益も無いのに管理するにはモチベーションが上がらない。これが本音かも。

皆様が書き込んでくれた情報ですが、整理なども大変なので、どうするかまだ決めてません。
ちなみに閉鎖と聞いて直ぐに「俺が引き継いでやるぜ!」って内容のアツいメールは一件もありませんでした。

あと、一応2chに書き込まれた情報を収集するプログラムは動かしておこうと思っています。
もしキー情報を検索するサイトが一つも無くなったら不便なので状況をみて復活させるかもしれません。
今のところ同じようなサイトがいくつかあるので、そちらを利用してください。

以上です。今までありがとうございました。



追記
3/25
・閉鎖直前はサイトの情報を取得するプログラムで過剰にアクセスしてくる人が何人もいたから鯖が瀕死だったので、一部のメールがちゃんと受信できなかった可能性があるかも
鯖から送信される情報メールが一部届いていなかったから、推測ですけど。

・知りたいってメールが何件かあったので、まとめて構成なんかを書くと
鯖構成は基本的にDELL祭りで安いときに買ったペンD1台に全部詰め込んでた。他にバックアップ用1台。レン鯖は無駄に金がかかるのでプログラムを改良して
小規模でもできるようにした。回線は光。PVは多くて50万PV/dayくらいじゃないだろうか。一日のクエリ数はあまり気にしてなかったのでわからない。
ピークになるとコネクションが限界に達してたから鯖を増やすかメモリ増設して限界値を上げるなど改良の余地はありました。
キー情報の自動取得機能は、dat落ちした昔のものは●を買って今までの全部のスレからキー情報を抽出しました。意外とスレは多くないので3〜4万スレくらいじゃなかったかな?そこまで時間はかからないよ。
新しいやつは10分毎にcronで動かして収集してた。
コメントは後から付けた機能だけど、ただカラムをtextで追加しただけ。これはちょっと駄目ですね、他にやり方があったと思う。まあ気軽に一言だけコメントをつけれれば
いいなあというアイデアからつけた後付機能なので。
アフィはそこまで力を入れてなく適当に張ってたけど、そんなに儲からない。とりあえずクリック率が低いし。アマゾン置いてもあまり買ってくれないしね。さすがダウン板住民www徹底してるwww
(でもこれは上手な方に言わせるとお前のやり方が悪いから成果がでないんだよって言われるかも。web収入板で勉強したけど駄目だった・・・)
しかし自鯖にしてプログラムを改良してからはそこまで費用はかからなかったので、ローコストローリターンですね。あと夜とか別パソから普通にネットを見るのに多少障害が、重い。ルータもいいやつ選んだほうがいい。
一応こんな感じ。この程度の負担なら続けろよって人がいるかもしれないけど、やっぱ逮捕は怖いよ。身元が割れてるのでshareに元データを流すこともしないです。
この規模のサイトを試行錯誤しながら普通のサイトと違ってデータベース系なので負担とも戦いながら一人で四年も続けたのは結構がんばったと思うんだがどうだろうか?
まあこんな所です。たぶんこれで最後かな。以上です。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

561 :昼休み@名無しさん@停滞中 ★ :08/03/25 12:37:06 ID:???
関連スレ

keydbが閉鎖するらしい。share\(^o^)/オワタ
http://tmp7.2ch.net/test/read.cgi/download/1206095106/
keydb.infoを運営してた人に一言お礼をいうスレ
http://tmp7.2ch.net/test/read.cgi/download/1206097806/
keydb閉鎖
http://tmp7.2ch.net/test/read.cgi/download/1206097132/
ダウソ厨死亡keydb.infoが閉鎖
http://namidame.2ch.net/test/read.cgi/news/1206094856/


上の一番目のスレにsharedb.infoの管理人さんが書き込んでるですが
すごくとてつもなく大変なんだなーと。

他のミラー管理人さんの大変さも想像出来るです
トラフィックを増やしてしまって ごめんなさい

562 :昼休み@名無しさん@停滞中 ★ :08/03/25 13:03:48 ID:???
まあkeydbもsharedbもデータベース系のサイトといえるでしょうから
検索CGIが始終回りっぱなしなんだと思うので
やっぱり少し違うかな



で、みみずんさんも上京なさるそうで

みみずんさーばー移転のお知らせ (みみずんぶろぐ)
http://mimizun.com/blog/2008/03/post_447.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
 突然ですが、みみずんさーばーを移転します。
 これに伴い、休止する期間が数日程度できるかもしれません。やめるわけではないので、
ご安心ください。運が良ければ回線の光化だ。

 さて、そんなこんなでちょっと都内を散策。不動産屋の軒先では季節がらか、物件情報に
見入っている方をちらほら見かけます。私も、めぼしいのを見つけてはデジカメで撮影。

 〔中略)

 ちなみに、4月1日から新しい赴任先での仕事になります。あと1週間。まぢやばい。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


> やめるわけではないので、ご安心ください。

安心したです

ってよく見てみたら
赴任先が東京とは限らないかも。

563 :昼休み終了@名無しさん@停滞中 ★ :08/03/25 13:10:49 ID:???
nikaさんの所も大変そうだし
みんな大変そうだ

OSASK(中略)掲示板の更新履歴
http://com-nika.osask.jp/test/read.cgi/bbs/1166882974/l49

564 :昼休み終了@名無しさん@停滞中 ★ :08/03/25 18:28:29 ID:???
http://takatyan.ddo.jp/test/read.cgi/main/1192376543/65

お疲れ様です
予告の段階ですが

565 :名無しさん@停滞中 ★ :08/03/26 19:42:39 ID:???
http://tmp7.2ch.net/test/read.cgi/download/1206095106/880

可能です
作れると思います
例によってwsh+●ですが


もし作って置いとけば
特定板の全スレッド過去ログ倉庫みたいなものを
取得公開してくれる人とか登場なさるかもですね

566 :名無しさん@停滞中 ★ :08/03/28 19:44:40 ID:???
メモ

http://touch.xrea.jp/janetouch/read/yutori.2ch.net/news4vip/1206547314/l
http://touch.xrea.jp/janetouch/read.php?host=yutori.2ch.net&bbs=news4vip&key=1206547314&start=l

上の二つですが
http://yutori.2ch.net/test/read.cgi/news4vip/1206547314/
が読めなくなっても閲覧可能だったら
どんなにか素晴らしい事でしょうか。

567 :名無しさん@停滞中 ★ :08/03/28 19:48:50 ID:???
たった今dat落ちしましたが
閲覧可能ですね

では追加させて下さいです
「その38」という事で

568 :名無しさん@停滞中 ★ :08/03/29 12:33:25 ID:???
>>562の理由で
みみずんさんの所繋がらないですが
金麦冷やして待ってる

569 :名無しさん@停滞中 ★ :08/03/29 12:39:54 ID:???
やはり上京なさるそうで

※※※※大森スレッドだよ〜ん フォルァ!! (その98)※※※※
http://tokyo.machi.to/bbs/read.pl?BBS=tokyo&KEY=1202773128&START=415&END=415



金麦冷やして待ってる
      ↓
まだ、待ってみる
      ↓
mimizun.com移転公開
      ↓
と、そう簡単なものじゃ無い
      ↓
金麦もう飲んじゃうから〜!
      ↓
と、いいつつおとなしく待つ


・・・みたいな事になっても仕方ないですが
うんきっと大丈夫
そのうちスレッドが立つかもしれないけど
たぶん大丈夫

570 :名無しさん@停滞中 ★ :08/03/29 14:25:53 ID:???
うん大丈夫だった
良かったー

http://jbbs.livedoor.jp/bbs/read.cgi/computer/682/1144317464/671-672n

IPアドレス移転によるバーボン頻発なんて事態には
多分なんないですよね
ごめんなさい

571 :名無しさん@停滞中 ★ :08/03/30 18:42:13 ID:???
>>566-567を追加させて頂いたです

dat化もですか
疲れちゃった

572 :名無しさん@停滞中 ★ :08/04/01 17:32:21 ID:???
イベントをしつらえられなければ馬鹿も出来ないなんて
年中ばかに馬鹿な事バカバカやってバカにされてる人間には困った日ですね


という事で気まぐれにやってみたです
反応を見るとIEの方が本当に多いなあと。
IEとそれ以外では見え方が全然違うもんで。

で、さっき少しだけ時間がとれたので差し替えたです


このページですが
ここは極東 日出づる国だもんで
地球のどこかで4月1日があるうちはまあいいじゃないかと
ワールドワイドウェブ 全世界からアクセス出来る訳だし
って いつ差し替えたらいいのかわかんないので良い言い訳になりますな

573 :名無しさん@停滞中 ★ :08/04/05 17:41:29 ID:???
http://society6.2ch.net/test/read.cgi/gline/1165245437/561-564n

今頃気付いたです
ありがとうです

少し考えをまとめてからと思うですが
・・・何か書き込みしづらいな。

574 :名無しさん@停滞中 ★ :08/04/05 18:48:53 ID:???
ところで
Win/Mac/Linuxのどれでも使えるような言語って何かないですかね?

JavaScriptなんかはどれでも同じように使えてるみたいで
だからMac環境でもミラーが見つかるんですが
それ以上のファイル加工その他(dat化等)はJavaScriptでは出来ないですし。

PythonだとMacから発祥したそうなので(http://sakito.s2.xrea.com/python/trypy/intro.html
これで何とかなりそうな感じなんですが
コマンドラインを使わない方法がよくわかんないので棚上げっぽい。




ちょっと話がずれるですが
あと もしかしたら偉そうにみえたらごめんなさいなんですが


Windowsの場合、テキスト操作やダウンロードその他
大抵の事がけっこうWSHで賄えてしまえる感じなので
何だか他のアプリ作成ソフトにチャレンジする意欲が湧かないんですよ。
例えばDelphiやC++Builderをマスターして何かツールを作ったとしても
結局Windows環境でしか使えないですし


って やっぱり偉そうにみえるかも
ごめんなさい

575 :名無しさん@停滞中 ★ :08/04/05 19:07:45 ID:???
V2Cとか見ると
Javaがいいのかもしれない
Macだと標準で入ってるぽいですし

V2C Top
http://v2c.s50.xrea.com/

ただWindowsだとJDKを入れないといけないみたいで
自分のマシンには入れる余力が無さそうです
インストーラだけでも70メガくらいあるみたいですが
自分のHDDの残りを鑑みると入れられなさそう



まだ電話回線の時に下記ページを見てチンプンカンプンでしたが
ついさっきググって見てみたら結構何とかなりそうな感じ。

JAVAプログラミング講座「宇宙のJAVAさん」
http://bakuretuken.birdynet.com/sorajava/index.html

この講座開設当時のJDKインストーラは10メガくらいだったそうで
今 そのサイズのインストーラが切実に欲しいです。
それくらいなら入れられるので。

探せばあるのかな。

576 :名無しさん@停滞中 ★ :08/04/05 19:19:18 ID:???
あるいはRubyがいいのかな

MacでPython Part 1
http://pc7.2ch.net/test/read.cgi/mac/1105894574/10
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
10 名前:名称未設定 [sage] 投稿日:05/01/17 08:33:56 ID:cSlQLY5N
日本だとRuby使いのが多いかもねぇ。こちらもOS Xに標準で入ってるし。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

あと現役スレだと
下のとかありますし

RubyCocoa 初心者質問【Leopardバンドル記念】
http://pc11.2ch.net/test/read.cgi/mac/1193373811/l50

577 :名無しさん@停滞中 ★ :08/04/06 11:47:24 ID:???
やっぱpythonわかんない
「コマンドラインからの実行」ってどうやるんだろう・・・

誰に訊いてもバカにされそうだ。。

578 :名無しさん@停滞中 ★ :08/04/06 12:11:40 ID:???
あちこち覗いてみたけどよくわかんない。

あまりにも基本的すぎる事って
かえって訊けないものですね


        *'``・* 。
        |     `*。
       ,。∩      *    もうどうにでもな〜れ
      + (´・ω・`) *。+゚
      `*。 ヽ、  つ *゚*
       `・+。*・' ゚⊃ +゚
       ☆   ∪~ 。*゚
        `・+。*・ ゚

579 :名無しさん@停滞中 ★ :08/04/06 15:28:40 ID:???
2005-10-11 - とあるカフェの片隅で -In the corner of a certain cafe
http://d.hatena.ne.jp/toypoo/20051011
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Pythonをインストールしただけでは、Pathが通っていなかったので、
Autoexec.batに以下の一文を追加した。

set PATH="c:\python23;%PATH%"


ちなみに、OSは、Windows 98 SE。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


やってみたです
関連づけとPathは違うのかな

580 :名無しさん@停滞中 ★ :08/04/06 15:51:55 ID:???
これも

Python入門 Windows用環境の準備 福田洋一
http://tibet.que.ne.jp/otani/2005program/install.html

どうやら大いに思い違いをしていたようです
ああ恥ずかしい

581 :名無しさん@停滞中 ★ :08/04/06 18:47:07 ID:???
何とかパスを通して
コマンドプロンプトから起動出来るようになったです

というか
OS毎に呼び名や操作が異なるようで
自分のPCでは「コマンドプロンプト」ではなく「MS-DOSプロンプト」じゃないかー。
ルートディレクトリ変更方法も違うみたいで大分調べたですよー。

コマンドプロンプト(DOSプロンプト)の使い方
http://www.geocities.co.jp/zsnes_123/command/command.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Windows2000, XPにはコマンドプロンプトが、WindowsMe以前のOSにはMS-DOS
プロンプトが備わっています。起動方法は、

* XP:Windowsの「スタート」ボタン→すべてのプログラム→アクセサリ→コマンドプロンプト
* 2000:Windowsの「スタート」ボタン→プログラム→アクセサリ→コマンドプロンプト
* Me以前:Windowsの「スタート」ボタン→プログラム→アクセサリ→MS-DOSプロンプト

となっています。

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
その2:カレントディレクトリのあるドライブとは違うドライブにあるディレクトリを
カレントディレクトリにする際は、「cd」とパスの間に、「/d」というオプション(コマ
ンドの実行内容を変化させるために書くもの)を記述する必要があります。例え
ば、カレントディレクトリがC:ドライブにある時に、D:\folderAをカレントディレクト
リにしたい時は、

cd /d D:\folderA

と入力しなければいけません(「cd」と「/d」と「パス」の間には半角スペースを入
れます)。ただし、この方法はコマンドプロンプトでしか使えないので、DOSプロ
ンプトの時は、

D:

のようにまず、カレントディレクトリにしたいディレクトリがあるドライブのドライブ
レターを入力してから、

cd D:\folderA

と入力しなければいけません。この方法はコマンドプロンプトでも利用できます。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


このページに辿り着くまで
すんげードツボにはまってたです。
いやー疲れた

で、nanabitさんの所にある
nicovideo.jpのflv/xmlをダウンロードするスクリプトとかコマンドラインから試してみたら
ちゃんと使えるですね。
こりゃすごいや



メモ
コマンドプロンプトを使ってみよう!
http://ykr414.com/dos/
コマンドプロンプト:『cd』コマンドの使用例
http://cmd-pro.com/com_00.html

582 :名無しさん@停滞中 ★ :08/04/06 19:14:03 ID:???
何とかMS-DOSプロンプトから実行する方法が判ったので
次はMacでのpythonスクリプトの実行方法ですが
これはもう精通している方に伺うしかないです


恥を忍んで専門スレで訊いてみようかな
「ウザい氏ね」みたいな事はないと思うですが
下のような反応は大井松田にダイソーが
もとい おおいにありそうな




お前ら、wsh使ってますか? Part7
http://pc11.2ch.net/test/read.cgi/win/1190548945/175-176n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
175 名前:名無し~3.EXE[sage] 投稿日:2008/04/06(日) 13:59:10 ID:AOV8Fp3G
先生、どこから突っ込んでいいのか分かりません!

176 名前:名無し~3.EXE[sage] 投稿日:2008/04/06(日) 18:02:36 ID:sJp4hCiu
175よ、お前のスルー力が試されておる。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

583 :名無しさん@停滞中 ★ :08/04/06 19:19:36 ID:???
メモ

python入門
http://word.starword.org/python/index.html
Pythonを始めよう:CodeZine
http://codezine.jp/a/article/aid/1617.aspx?p=1

584 :昼休み@名無しさん@停滞中 ★ :08/04/07 12:38:16 ID:???
Macでのコマンドプロンプト画面は
「ターミナル」と言うみたいですね。

Mac用 実況向けスレッド型掲示板ビューアー Palloo - Programming Must Go On
http://d.hatena.ne.jp/kenkitii/20070922/p1
学務情報システム成績自動入力
http://enju.pc.uec.ac.jp/ohfuti/gakumu/index.html
JavaFlavor Weblog: SISInfo - Symbian 9.1 S60 3rd対応のSISファイル解凍ツール
http://javaflavor.cocolog-nifty.com/blog/2007/09/sisinfo_symbian_7e45.html
MACのDOSプロンプトでWindowsのipconfig /releaseと同じコマンドは? - 教えて!goo
http://oshiete1.goo.ne.jp/qa2625482.html
コマンドプロンプトを使ってみよう! - Windows・Macの便利・無料のツール・ソフトウェア情報まとめ
http://tools.rightclicksright.net/data/9972.aspx
MacWiki - UNIXの基本コマンド
http://macwiki.sourceforge.jp/wiki/index.php/UNIX%E3%81%AE%E5%9F%BA%E6%9C%AC%E3%82%B3%E3%83%9E%E3%83%B3%E3%83%89
ターミナルはじめの一歩 - [Mac OSの使い方]All About
http://allabout.co.jp/computer/macos/closeup/CU20030210tam/


で、実行方法がわかんない。
これかな?

http://usamimi.info/~mirrorhenkan/2ch/python/prog/read.php/1053955472/858n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
858 デフォルトの名無しさん [ 03/11/06 02:04 ]
現行のPythonでも,ファイル名を指定してPythonインタプリタを起動することが
できます.
Windowsを使っている場合:
  コマンドプロンプトで,
  python.exe helloworld.py
MacOSXを使っている場合:
  アプリケーション/ユーティリティ/Terminal.app を起動して
  python helloworld.py
Linuxを使っている場合:
  シェルで
  python helloworld.py

です.上の記述はIDLEやPythonシェル (>>> を表示するウィンドウ)
で行う操作ではありません.

http://www.python.jp/pipermail/python-ml-jp/2003-October/004988.html
から始まるスレッドも参考にしてください.
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−




GUIに慣れた者にとっては
ダブルクリックで実行出来ればいいのですが。

WindowsだとエクスプローラからのWクリックで実行出来るんだけどなー。

585 :名無しさん@停滞中 ★ :08/04/07 18:57:57 ID:???
またはこれかな。

Mac OS X初心者質問用スレ 24.5
http://pc11.2ch.net/test/read.cgi/mac/1206375011/2
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
2 名前:名称未設定[sage] 投稿日:2008/03/25(火) 01:11:07 ID:AjJPMnQr0
よくある質問1

(中略)

Q. ファイルをゴミ箱に捨てることができない、またはゴミ箱を空にすることができない
A. 再起動する、または Optionキーを押したままゴミ箱を空にする、
または

 1. Terminal を起動する
 2. rm と入力する (rm の後に半角スペース)
 3. 消したいファイルを Terminal のウインドウにドラッグ&ドロップする
 4. return を押す
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−



これを応用すると
MacOSでのpythonスクリプトの実行方法は

 1. Terminal を起動する
 2. python と入力する (python の後に半角スペース)
 3. 実行したいpyファイルを Terminal のウインドウにドラッグ&ドロップする
 4. return を押す

という事になるですが。
さてこれでOKなのかどうなのか。



・・・てか、これ見て
MS-DOSプロンプトにpyスクリプトをD&Dしたら
Windowsでも使えるじゃないですか!!
いちいち打ち込むこたあなかったのか!!

586 :DinoSwift ◆m7TsEz1c5. :08/04/08 14:04:53 ID:GxFpUjbx
(へ´ω`) >>581
      昔はDOSプロンプトって言ってました。
      今はms-dosを下地にしてないのでコマンドプロンプトという名称になってます。
      dosコマンドは種類が少ないので一回覚えたら後は簡単だよ。
      ただしlinuxみたいにいろいろ出来ない難点があるけども。

md(ディレクトリ/フォルダ作成)
rd(ディレクトリ削除)
del(ファイル削除)
copy(コピー・新規ファイル作成)
type(ファイルの中身表示)
dir(unixでいうところのls。カレントディレクトリ内の一覧表示)
cd(ディレクトリの移動)

大体、MS-DOS時代の主なコマンドはこんなもん。
それ以外の「ipconfig」や「tree」なんかはwindows時代になってからのものなので
バージョンによってはないかもしれない。

587 :DinoSwift ◆m7TsEz1c5. :08/04/08 14:08:41 ID:GxFpUjbx
(へ´ω`) なんだdosそのものの話じゃなかったのか。
      失礼しました。

588 :名無しさん@停滞中 ★ :08/04/08 19:55:24 ID:???
>>586-587
いえいえおおいに頭の整理になったですです


http://society6.2ch.net/test/read.cgi/gline/1165245437/574-575n

スレッドのお題に即した事しか書いてないつもりですが
でもやっぱり茶々が入りそうだなとか思ったけど
まあ色々仕方がないです

589 :名無しさん@停滞中 ★ :08/04/08 20:08:41 ID:???
メモ
すごいやすごいや

スレタイ検索
http://mirror.takatyan.info/title_search/title_search.cgi
2ちゃんねる過去ログ倉庫スレタイ検索 情報画面
http://mirror.takatyan.info/title_search/crawl_schedule.cgi
2ちゃんねる過去ログ倉庫スレタイ検索 説明
http://mirror.takatyan.info/title_search/about.html


全板全過去ログからのスレタイ検索とかしたら
何ギガバイト必要になるのかな。
1板1メガとしても700板で700メガですし
1板10メガで均らしたとしたら7ギガですし
news4vipなんかだとsubject.txtだけでも例えばex14サーバだけで200メガ以上ある訳だし
ほんと何ギガ必要なのかなと考えると
気が遠くなりそうです

590 :名無しさん@停滞中 ★ :08/04/11 18:11:50 ID:???
その39を追加させていただいたです
mirrorhenkanのぽっぷちゃっとに管理人さん自ら公開されておられたので
まあいいかなと。

http://www.geocities.jp/mirrorhenkan/sono39/?u=http://society6.2ch.net/test/read.cgi/gline/1165245437/


サイトのURLはこちら
けっこう古いログも保管されておられるですね。

2ch過去ログ
http://123.225.123.197/index2.htm

固定IPという事なのかな。
URLが数字だと何か味気ないので
どこか無料のダイナミックDNSをつけて貰えたら嬉しいなー。

あとサイトの名称と。
とりあえずぽっぷちゃっとのアカウント名は「2xxcache」みたいですが

http://popchat.nu/users/2xxcache/

上記のフレーム内の
http://2xx.dyndns.org/
は 何だか繋がらないです
まだDNS浸透していないだけかもですが

591 :名無しさん@停滞中 ★ :08/04/11 18:41:58 ID:???
メモ

L'eclat des jours(2008-03-17)
http://arton.no-ip.info/diary/20080317.html
Rubyist Magazine - Rubyist Hotlinks 【第 15 回】 arton さん
http://jp.rubyist.net/magazine/?0015-Hotlinks
ホワイの(感動的)Rubyガイド
http://www.aoky.net/articles/why_poignant_guide_to_ruby/
From a Far East Island
http://d.hatena.ne.jp/norisuke3/
Lisp プログラマのための Python 人門
http://www.unixuser.org/~euske/doc/python/python-lisp-j.html
How To Become A Hacker: Japanese
http://cruel.org/freeware/hacker.html

592 :名無しさん@停滞中 ★ :08/04/12 15:56:49 ID:???
datをUTF8にするのはどうだろうスレッド
http://qb5.2ch.net/test/read.cgi/operate/1207973589/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1 名前:ひろゆき@どうやら管理人 ★[] 投稿日:2008/04/12(土) 13:13:09 ID:???0 (PC) ?S★(1017889)
datをUTF8にするのはどうだろうスレッドです。

影響があるのは、AA周りすかねぇ。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


うっひょー


まあ自分が何か書き込んでも
完全スルーなんでしょうな。

593 :名無しさん@停滞中 ★ :08/04/12 16:25:50 ID:???
そういう板もあったらいいなとは思ってたですが

他ならぬひろゆきさんが書いておられるので
文字コードUTF-8のdatを使う掲示板も実現するんだろうなと。

ただ

http://qb5.2ch.net/test/read.cgi/operate/1207973589/32
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
32 名前:ひろゆき@どうやら管理人 ★[] 投稿日:2008/04/12(土) 14:08:38 ID:???0 (PC) ?S★(1017889)
anydat.soみたいなサーバ処理がいらないものだけで、
回せないかなと。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

前にやりかけたですけど
文字コードShift_Jisのdatでも出来るんじゃないかなぁ・・・

594 :名無しさん@停滞中 ★ :08/04/12 18:02:06 ID:???
メモ

どう書く?org
http://ja.doukaku.org/

プログラミングスレまとめ in VIP - プログラミングスレまとめ in VIP
http://vipprog.net/wiki/
VIP de Programming
http://vipprog.tumblr.com/
プログラミングでもやろうよ
http://ex14.vip2ch.com/test/read.cgi/part4vip/1180409126/

595 :でめ :08/04/12 18:16:58 ID:4spp4fiv
お初にお目に掛かります。>>590 のサーバの運用をしています「でめ」と言います‥‥

URL中ののIPアドレスでクグッたらこの掲示板がヒットしたのですっ飛んでまいりました。

>その39を追加させていただいたです
>mirrorhenkanのぽっぷちゃっとに管理人さん自ら公開されておられたので
>まあいいかなと。

webのログを見たら‥何じゃこりゃー 直リンの雨あられ(以下略
そんでもってrefer見たらその39が作られている‥( ゚o゚)
‥自分もまあいいかなと思ってます。

596 :でめ :08/04/12 18:17:49 ID:4spp4fiv
以下>>595 の続き

URL中のIPアドレスは固定ではないです(通常のダイヤルアップ)。動的IPなので
ルーターの電源をカーチャンが掃除機で(ry  となる可能もあります。
いざとなったら、夜逃げもしやすいし。
夜逃げしたあと、今のIPアドレスを使う人がいたら
その人のルーターのport80は火の車(以下自重

2週間程度を目処にデバックを兼ねたテスト公開をしたいと思ってます。
まだあっちこっちバグだらけでwebサービス部分がまだ相当ダメダメ。特に検索機能
がヤバいです。さっさと作り直さねば‥

おおっDino氏もいらっしゃる。その節はお世話になりました‥って覚えてないか(ry
5秒以下の間隔でクローリングするとバボられると書き込んだアレです。


597 :名無しさん@停滞中 ★ :08/04/13 10:56:46 ID:???
>>595-596
これはこれはどうもです
そんなにアクセスあったですか。
何だか色々すみません。

DinoSwiftさんの所の書き込みというと下記ですか。

http://wannabe.fam.cx/index.cgi?mode=blog&page=1201533481

3年前からクローリングなさっておられたとは。
動的IPなのに3日間変わってないということは
安定したサーバ運営の技術をお持ちなのですね。
すごいなー

では今後共宜しくお願い致します。

598 :名無しさん@停滞中 ★ :08/04/14 19:50:23 ID:???
メモ

暇だからdatの補完とかしてみる
http://dat.hitobashira.org/

マカーの方みたい

ようこそバーボンハウスへ
http://hitobashira.org/

599 :名無しさん@停滞中 ★ :08/04/16 12:43:31 ID:???
紹介マニア->Pythonメモ->Python基本メモ
http://sakito.s2.xrea.com/detail/python/pybase.html

python面白いです
ただ 標準で入っているMacでのpython使用方法が
まだわかんない。

あまりにも当然過ぎる事って却って説明とかも無いのかも。
考えてみれば、Windowsでのエクスプローラ使用方法とかも
説明ページがなかなか無さそうです
この板だって、トリップはともかくとして
キャップ(★)の付け方とか最初よくわかんなかったですし

いっぺん
馬鹿にされるのを承知で訊いてみるですか

600 :名無しさん@停滞中 ★ :08/04/16 17:05:30 ID:???
http://nicowiki.com/tools.html
http://www.virtual-pop.com/tearoom/archives/000183.html
http://site.halfmoon.jp/movielist/75.html
http://zapanet.info/blog/item/931

601 :名無しさん@勉強中 :08/04/17 03:21:07 ID:CDFimzvZ
こんにちは。暇つぶし2chのeucalyptus.と申します。

>>153 死ぬほど亀レスですが。
明示的に「dat落ち変換機」とは謡っておりません。
ので、あんな書き込みになっておりますが、どうかお気になさらず。。。

もし可能でしたら、以下項目について、調整頂けると助かります。
・BBSPINKについて
 BBSPINKは、ホスト名に識別フラグをつけて管理しております。
 識別フラグは、「ホストネーム」+「bbspink」です。
 ex : ( perl )
  $url = 'mobile.seisyun.net/cgi/read.cgi/'.$bbs.'/'.$hostname.'bbspink_'.$bbs.'_'.$key.'/1';
  or
  $hostname .= 'bbspink';

・携帯端末用URLについて
 以下のURLにて、携帯端末用のサイトを公開しております。
 よろしければどうぞです。
  tp://mobile.seisyun.net/cgi/agate/$hostname/$bbs/$key/a
  hostnameのBBSPINKフラグは、上記実装と同様です。

 以上です。

602 :名無しさん@停滞中 ★ :08/04/17 20:13:22 ID:???
>>601
今日は。わざわざ有り難うございます。
今晩は余裕が無いのでレスのみにて

BBSPINKの件 ありがとうございます。完全にノーチェックでした。
makimo.toさんの所のBBSPINKの条件分けより遙かに簡単なので
後ほど修正させて頂くです

# メモ
# 前→ http://mobile.seisyun.net/cgi/read.cgi/set/set_avideo_1204860044
# 後→ http://mobile.seisyun.net/cgi/read.cgi/set/setbbspink_avideo_1204860044


携帯用URLもありがとうございます。
携帯用変換機のほうも全然直してなかったので
これを機に何とかしてみようかなと思います。

携帯用URLについてなのですが
レス1と最終レス(を含む数レス)を同時に開くようなオプションはありますでしょうか。
もしあれば御教示頂けたら嬉しいです(無ければ無いで別に構いません)



とりあえず
イナバウアーの如くのけぞりつつ
失礼致しますです

603 :名無しさん@勉強中 :08/04/17 23:22:02 ID:CDFimzvZ
>>602
 BBSPINKの件、お手数をおかけします・・・。

 携帯用URLですが、ご提案のオプションは、残念ながら実装していません。

 ので、先ほど実装しました。
 URL呼び出しは、以下のとおりです。
  mobile.seisyun.net/cgi/agate/$hostname/$bbs/$key/ia

 以上、よろしくお願いします。

604 :名無しさん@停滞中 ★ :08/04/18 19:27:36 ID:???
という訳で
PC版のほうはeucalyptus.さんから御指摘頂いた書式に変換したです


> 携帯用URLですが、ご提案のオプションは、残念ながら実装していません。
>
> ので、先ほど実装しました。
> URL呼び出しは、以下のとおりです。
>  mobile.seisyun.net/cgi/agate/$hostname/$bbs/$key/ia

ありがとうございます。
携帯用のもぼちぼち取りかかろうと思いますです

# メモ
# http://mobile.seisyun.net/cgi/agate/society6/gline/1165245437/ia
# http://mobile.seisyun.net/cgi/agate/yomibbspink/801/1198984252/ia

605 :名無しさん@停滞中 ★ :08/04/18 19:42:55 ID:???
さて
pythonのpathを通したのを参考にして
perlのpathも通してみたです。

このpath通しをしなかったから あちこちのperl説明サイトも訳わかめだったのだなーと。
PCのコヤシに成り果てていたのだなーと>perl


で、早速
http://2ch.eucaly.net/monazilla/dattotext/
をダウンロードして実行してみたら
datがtext化されてローカル保存されるじゃないですか!!
すっげー!!
すっげー!!


ところで、大した事のない重箱の隅ですが

> ・動かし方
>  perl texttotext.pl
>  とやってみましょう。
>  自動的にDATを取りに行き、HTMLファイルを作ります。

これ「TEXTファイルを作ります」ですよね。
って ごめんなさいごめんなさい


ちなみに
http://2ch.eucaly.net/monazilla/dattohtml/
も同様に実行しようとしたら
「warning.plが無いよ」とエラーが出たです。
use warning: の箇所なのでしょうか。
まあ古ーいperlだから仕方なさそうです。

606 :名無しさん@勉強中 :08/04/19 01:25:33 ID:EsxJ2WcO
こんにちは。eucalyptus.と申します。

>>605
 ご利用&ご感想ありがとうございます。。。
 6年も前のソフトなので、動くかどうかアレだったのですが、無事動いたようでなによりです。
 ただし、今このソフト動かしてしまうと、リロードバーボンに引っ掛かってしまうかもです。
 なので、もし常用するのであれば、dat記述ファイルを以下の通り書き換えると安全かと。

  hoge.txt[TAB]bg20.2ch.net/hostname.2ch.net/bbsname/keyid/

 dattotextとdattohtmlは、ほぼ同じスクリプトなので、片方動けばなんとかなる
 予感がするのですが・・・、、、。

 #ご指摘の箇所、直しておきました・・・。

607 :名無しさん@停滞中 ★ :08/04/19 19:57:26 ID:???
鬼のように疲れちゃったです

>eucalyptus.さん
もう一度DLし直してやってみたらうまく動いたですごめんなさいごめんなさい
みみずんさんの所のdattohtml.plは此方のものを改造されてるのかな。

perlもローカル環境で色々出来そうですが
最近の使えそうなperlスクリプト、例えばnicovideo.jpのflv取得するものなどを試してみると
何だか色々追加モジュールを入れなければならないみたいなので
二の足を踏んでるです
この場合はwshやpythonで同等の事が出来るのでいいのですが。
それにしてもperlはどうしても苦手意識が消えないなあ・・・。

ところで
eucalyptus.さんのお名前ですが
藤岡弘、さんや
モーニング娘。さんのように
eucalyptus.さんなのですか。
ってどうでもいい事ですねごめんなさいごめんなさい

608 :名無しさん@停滞中 ★ :08/04/20 15:24:40 ID:???
>>589を追加させて頂いたです
makimo.toさんのスレタイ検索フォームの下

589の段階では試してみても全然ヒットしませんでしたが
99%クロールされた今だとすごくあれこれヒットしますですね。
すごいやすごいや

609 :名無しさん@停滞中 ★ :08/04/20 16:48:17 ID:???
http://qb5.2ch.net/test/read.cgi/operate/1207973589/316-320n

316は私じゃないです><
まあ別にいいですが

実験板でも何でもいいですから
とりあえず早いとこ
datがUTF-8の板を設置して試してみて下さいです><

ひょっとしたら 瓢箪から駒かもしれないじゃないですか。
0chのUTF-8版を出してみたら、身も知らぬ異国の方々が使ってるのを見て
何だか感動したですよ
管理画面はまだ日本語のままだったのに。

でもまあ
ひろゆきさんの思惑はその辺りには無さそうなので
ここまでの話なんですかね。
5年前には下のような事を書かれてはいましたが
今の現実は予想を上回っていると思うのです

http://mirror.s151.xrea.com/2ch/0chu/test/read.cgi/utf8/1048754153/25




というような文章を

http://qb5.2ch.net/test/read.cgi/operate/1207973589/l50

に投稿しようかなとか思ったですが
まあいいや
打たれ弱いので、煽られるとへこみますし

610 :名無しさん@停滞中 ★ :08/04/20 16:59:32 ID:???
ついでに書くと

海外ドメイン規制ってどれくらいつけてあるんでしょうか。
下のスレッドの書き込みとか見ると何だかなあと思ったですが
って外野があれこれ言っても無駄でしょうけど

http://qb5.2ch.net/test/read.cgi/operate/1207973589/64-65n

> 海外ドメイン規制(fr)。2ちゃんねるビューアを使うと書き込めます。
> ホストm69.net81-66-109.noos.fr
>
> (中略)
>
> frドメイン全部禁止とはひどいなぁ
>
> ホテルの有料回線は.netだからいけるみたい


他の板のスレッドでの書き込みとか見ると
台湾や韓国やカナダやアメリカやフランスやスウェーデンやアルゼンチンはOKなのに
何でフランスのドメインからは書き込めないのでしょう。
どれくらいの範囲の板でこうなのでしょう
海外生活板とかは大丈夫なのでしょうか。

いえ、単に
フランスの人が「萌え〜☆」とか書いてるのを見て
和んでみたいだけなんですが。

611 :名無しさん@停滞中 ★ :08/04/20 17:54:21 ID:???
> 台湾や韓国やカナダやアメリカやフランスやスウェーデンやアルゼンチンはOKなのに

フランスは入ってないってば
ちなみにスウェーデンやアルゼンチンは例えば下

【外人専用】Welcome to Hello! Project "Wolf" @ 2ch BBS ! 【for foreigner's exclusive use】
http://ex23.2ch.net/test/read.cgi/morningcoffee/1194292498/
【外人専用】Welcome to Hello! Project "Wolf" @ 2ch BBS !【for foreigners' exclusive use】2
http://ex23.2ch.net/test/read.cgi/morningcoffee/1194544402/
【外人専用】Welcome to Hello! Project "Wolf" @ 2ch BBS !【for foreigners' exclusive use】3
http://ex23.2ch.net/test/read.cgi/morningcoffee/1194950987/
【外人専用】Welcome to Hello! Project "Wolf" @ 2ch BBS !【for foreigners' exclusive use】4
http://ex23.2ch.net/test/read.cgi/morningcoffee/1195116775/
モーニング娘。って欧米でも人気あるんだね
http://mamono.2ch.net/test/read.cgi/morningcoffee/1200384865/

というか
>>608であれこれ検索すると(例えば「カナダ人だけど」とか「台湾人だけど」等)
すっげーわんさか出てきますね。
makimo.toさんの所のだと実況板はあまり出てこないですが
takatyanさんの所だと実況板の突発的な単発スレも沢山ヒットするです

612 :名無しさん@停滞中 ★ :08/04/20 18:50:17 ID:???
さて
eucalyptus.さんがいらっしゃったのですが
リンクから飛んだスレが下記

【Hikkyの友?】お好みスレをメール配信 datchecker
http://pc.2ch.net/test/read.cgi/mobile/1024280588/
http://pc.2ch.net/mobile/kako/1024/10242/1024280588.html

> 2chの任意のスレッドを監視し、更新があるとメールで知らせます。
> perl + 常時接続が必要で敷居は高いですが、スレの書き込みチェックなんかに便利かも。


これwshでも出来そうですね。
更新チェックしたいdat一覧を別途テキストにまとめておいて
スレッドのdatにhead送信して
返って来たレスポンスからdatの更新時間を調べて
更新があったらメールすると。
チェックするインターバルはタスクスケジューラを使ってもいいですし
以前datgetでやったようにループ構造にしても良さそう。

問題は、wshでメール送信する方法なんですが
BASP21を使うしかないかなとか思って検索したら
標準機能だけでも可能みたいですね。
何とかなりそうじゃないですか。

wsh メール - Google 検索
http://www.google.co.jp/search?hl=ja&q=wsh+%E3%83%A1%E3%83%BC%E3%83%AB&lr=
WSH(JScript)でメールを送信する | Weboo! Returns.
http://yamashita.dyndns.org/blog/358/
VBScript でメールの送信:ある nakagami の日記:So-net blog
http://nakagami.blog.so-net.ne.jp/2005-11-27




あと上記スレの派生元スレですが

2chテキストでじっくり読み
http://pc11.2ch.net/test/read.cgi/mobile/1022865453/l50

これも同様にwshで出来そうです
それにしても現役スレッドなのですか。。

613 :名無しさん@勉強中 :08/04/20 20:35:13 ID:ToiV6qHB
23ch.infoさんの過去ログをhtmltodatで
変換するにはどうすればいいのですか?


614 :出がけ@名無しさん@停滞中 ★ :08/04/21 07:35:48 ID:???
>>613
「read.cgi7.00?」でどうでしょうか。



>>610のURLはこっちでした
http://etc7.2ch.net/test/read.cgi/charaneta2/1207815243/64-65n

615 :名無しさん@勉強中 :08/04/21 20:46:58 ID:SYHh6dp7
>>614
レスありがとうございます。ですが
「read.cgi7.00?」だけでは分かりません。
もう少し詳しく教えてもらえませんか?

616 :疲労コンパイル@名無しさん@停滞中 ★ :08/04/21 21:06:58 ID:???
>>615
えーと

ごめんなさい
うまいこと説明する自信が全くありませんです
申し訳ないですが他の方お願いします

htmltodat作者のmukiyuさんに振っても御迷惑でしょうから
下のスレッドあたりで訊いてみるのが一番いいかも。
ただ煽られたり無反応だったりしても気にせずに。

読めないdat落ちスレのhtmlミラー避難所[2]
http://society6.2ch.net/test/read.cgi/gline/1165245437/l50


図解を交えたhtmltodatの使い方の説明サイトとかどこかにないもんですかね。
自分とこだと
http://pasoport.jp/blog/2007/12/post-230.html
みたいな。(ってこれ↑以外にも幾つかあったけど すぐ出てこないや^^;)

誰か作ってないのかな(他力本願)

617 :名無しさん@勉強中 :08/04/22 01:42:56 ID:qL4H1sOI
ちょっと思ったんだけどhtmltodatを
ttp://www.geocities.jp/mirrorhenkan/htmltodat/
のことだと思われてるってことはない?w

でも冗談でなく、ttp://www.geocities.jp/mirrorhenkan/から明示的にリンク貼られてるわけでもないし
知らない人が初めて来たらそっちに行っちゃっても不思議じゃないかと思って。

618 :涙は心のアセンブラ@名無しさん@停滞中 ★ :08/04/22 18:33:17 ID:???
>>617

なーるほど
それは確かに
アリエール

てなわけで
リンクをつけて
みましたの

ついでにね
検索結果も
追記して

疲れたよ
心身共に
ダルビッシュ

619 :内山理奈ックス@名無しさん@停滞中 ★ :08/04/22 20:13:32 ID:???
ところで
http://www.geocities.jp/mirrorhenkan/htmltodat/
ですが
試しに23ch.infoさんの所のhtmlソースを貼り付けてやってみたら
今でもちゃんと使えますね。
ただし、正規表現内の「<dt>」を「<dt.*?>」に変えないといけないですが。
気が向いたら直しておきますか。

って結構使えるじゃないですかこれ。
何故かLinux板で貼られてるのを見た事があるですけど
Mac環境でも使えるんじゃないかな。

620 :渡辺満Linux@名無しさん@停滞中 ★ :08/04/22 20:35:08 ID:???
ついでに
みみずんさんの所の全文検索フォームも使えるようにしたです
使えなくなっていたので(ってだいぶ前からでしたけど)

試してみると
新Mac板でpythonの事について触れられているのは
現在17スレッドみたいですね

けっこう活発でみんな楽しそう。
で、目についたのがこの↓レス


【WebKit】Dashboard - Part 7【ウィジェット】
http://pc11.2ch.net/test/read.cgi/mac/1178316285/167-168

> WorseTVはYahooのサイトの仕様が変わったせいみたいね。
> Python全然わからん上に、しょぼいハックですが一応動いたので報告。
> ホーム/ライブラリ/Widgets/WorseTV.wdgt内のloadtv2csv.pyに以下のパッチをあててください。
>
> *** loadtv2csv.py.org 2005-07-28 20:03:06.000000000 +0900
> --- loadtv2csv.py 2007-10-02 07:34:35.000000000 +0900


こういうスレッドとかでMac環境でのpython使用方法とか真摯に伺ったら
けっこう御教示頂けるかもしれないなとか思ったりして。

621 :鈴木紗Linux@名無しさん@停滞中 ★ :08/04/22 21:07:47 ID:???
きいてみたいのは
MacOSXを使っている場合:
  アプリケーション/ユーティリティ/Terminal.app を起動して
  python -h
と入力してエンターを押せば
pythonのヘルプ画面が表示されるのかというだけの事ですが。
もしかしたら
  %python -h
とするのだろうかとか
標準でpythonが入っていても
Pathを通す作業を先にしなければならないのか とか

ターミナルでpythonスクリプトを実行出来るとしたら
そのやりかたを pythonを使った事のないMac環境の方に伝える方法とか
実際に使えたとしたら
html2dat.pyでhtmlをdat化出来るのかとか
getimg.pyでWeb上のデータをローカル保存出来るのか とか。

622 :eucaly:08/04/22 22:23:03 ID:UuqUwhZr
>>621 横レスしてみる。
Mac OS X Server 10.5.2では、
usage: /System/Library/Frameworks/Python.framework/Versions/2.5/...
て表示されました。

バイナリは/usr/bin/pythonにリンクされているので、パス通っていると解釈してよさげです。

 #Serverと普通ので違ったらどうしよう・・・。

623 :名無しさん@停滞中 ★ :08/04/23 20:17:17 ID:???
うわー

>>622
横レスありがとうございますです。
もし良かったら、幾つか確かめて頂けないでしょうか。

(1) 適当なフォルダ(ディレクトリ?)を作って
下のファイルをダウンロード(Macでも「右クリック→対象保存」でいいのかな違うのかな)して

http://www.geocities.jp/mirrorhenkan/python/getimg.py.txt

拡張子をpyにリネームしてから

 1. Terminal を起動する
 2. cd と入力する (cd の後に半角スペース)
 3. 実行したいpyファイルがあるフォルダを Terminal のウインドウにドラッグ&ドロップする
 4. return (enter ?) を押す

これで、カレントディレクトリが
pyファイルがあるフォルダに移動したでしょうか。



(2) 上のpyスクリプトの実行について

 1. Terminalのカレントディレクトリがpyファイルがあるフォルダにあるか確認してから
 2. python と入力する (python の後に半角スペース)
 3. 実行したいpyファイル(getimg.py)を Terminal のウインドウにドラッグ&ドロップする
 4. return を押す

Terminalに何か表示されたでしょうか。
また、pyファイルと同じ場所にyahooの画像が保存されているでしょうか。
rubyのバージョンが出て来ますでしょうか。

624 :名無しさん@停滞中 ★ :08/04/23 20:32:26 ID:???
上の最終行は忘れて下さい・・


ここまで書いて力尽きたですが
あと簡単に二つほど

(3) Macでのzip解凍について

下のzipファイルは、Macでも解凍出来ますでしょうか。
(中身の実行方法については(1)(2)のように書く気力が今日は残ってないです^^;)

ttp://www.geocities.jp/mirrorhenkan/python/html2dat.zip
ttp://www.geocities.jp/mirrorhenkan/python/html2dat1.zip
ttp://www.geocities.jp/mirrorhenkan/python/htmltodat_for_cn2ch.zip


(4) MacOS X でのrubyのインストール状況

以前>>576で出したスレッドによると
MacOS Xにはrubyが標準で入っているとの事なので
確かめて頂けませんでしょうか。
Terminalで
 ruby -v
と入力してエンターして
rubyのバージョンが出て来ますでしょうか。(←>>623の最終行はこれを消し忘れただけで)



以上、もし宜しかったら試して頂けたら幸いです
というか幸せになります
では失礼します

625 :eucaly:08/04/23 23:10:16 ID:YozRwvHc
(1) 無事移動しました。
(2) 無事起動しました。ネットワーク周りも動作しました。
(3) ダウンロード→Finder経由で解凍できるようです。
(4) ruby 1.8.6 だそうです。

オマケ : ryファイルは、テキストエディタに関連付けされているみたいです。

以下にキャプチャ画面置いておきますね。

 dempamusic.com/musictemp/mox_py.jpg


626 :出がけ@名無しさん@停滞中 ★ :08/04/25 08:10:02 ID:???
>>625
ありがとうございます。
動きましたか!
ネット上のデータ取得も出来るという事は
今までwshで作ったものもpythonに書き換える事とか出来そうですね。
たぶん同様にrubyでも可能なのだろうなと。

や、何でこんな事やってるかというと
「Mac/Linuxだからwsh使えないよ」というような事があったら癪なだけですが。


取り急ぎ行ってきます

627 :名無しさん@停滞中 ★ :08/04/25 19:23:16 ID:???
さて
>>624の続きですが宜しいでしょうか。

(5) htmltodat100.pyの実行可否について

 (3)のzipですが、1番目と2番目の中身は同じです(圧縮ソフトを変えただけ)
 これを(2)と同じ要領でターミナルから実行すると
 同梱の2つのhtmlファイルからそれぞれdat生成されますか?

(6) ターミナルからのデータ入力

 http://www.geocities.jp/mirrorhenkan/python/getfile.py.txt

 上のファイルをDLして拡張子pyにして
 ターミナルから実行すると「URL please :」と表示されると思いますので
 適当なURLを入力実行してみて下さい。
 pyと同じフォルダに「test.txt」という名前でローカル保存されていますでしょうか。

(7) dat化したファイルを用いた dat2html.rb の実行可否について

 Script/Ruby
 http://www.moonwolf.com/ruby/

 上記URLの下のほうにあるdat2html(URLはttp://www.moonwolf.com/ruby/archive/dat2html-0.1.tar.gz)
 をDL解凍して(MacOSXでは標準でtar.gz解凍出来るでしょうか)
 (5)でdat化したファイルと同じフォルダにdat2html.rb/sage.rbの2ファイルを置いて
 (1)の要領でdat2html.rbがあるフォルダをターミナルのカレントディレクトリにして

 ruby dat2html.rb

 と入力エンターすると、
 datがhtml化生成されるでしょうか。

628 :名無しさん@停滞中 ★ :08/04/25 19:30:18 ID:???
MacOSXで試して頂きたく思うのはこのくらいなのですが
あと些細な質問を。(検索してもよくわからなかったので)

(a)「Finder」は、windowsのエクスプローラに該当するものなのでしょうか。
 wikipedia等を見るとそれっぽい感じですが。

Finder - Wikipedia
http://ja.wikipedia.org/wiki/Finder

(b) ターミナルではクリップボードのデータを右クリック貼りつけとか出来るのでしょうか。

(c) MSDOSプロンプトでは入力キーが英語キーボード配列固定みたいで
 例えば「http://」と入力しようとしても「http'//」となったり
 「\」が入力出来ないのですが
 Macのターミナルではどうなっていますか?

(d) Macでは「エンター」「リターン」のどちらですか?
 また「フォルダ」「ディレクトリ」のどちらが普通の呼び方なのでしょうか。


今のところは取り急ぎこんな所です。
質問が多くて申し訳ありませんです。
ごめんなさい

# 質問責め って・・・それってどんなプレイ?

629 :名無しさん@停滞中 ★ :08/04/26 21:27:05 ID:???
http://www.geocities.jp/mirrorhenkan/htmltodat/
を少し直したです
って2年半ぶりですか
といっても>>619の微調整だけですが

という事で

>>613
23ch.infoさんのhtmlソースを上のフォームに貼り付けて
変換ボタンを押せばdat化されるかも
あんまりよく見てないんで何ですが


これって頭をひねれば
前処理・後処理等も何とかなりそうですね。
変換の進捗状況も
JavaScriptのAppendChildを用いれば出来ない事もなさそうです

というか
正規表現その他も
本家htmltodatと同様にしたほうがいいかも。
「m#<dt.*?>([0-9]+).+?(?:"mailto:(.+?)">)?<b>(.+?)</b>(?:</font>|</a>) ?:(.*?)<dd> ?(.*?)<br><br>(<dt.*?>|</dl>)#mik」
みたいに。
まあ JavaScriptでmコマンドとかやっても全然意味ないんですが。

630 :名無しさん@停滞中 ★ :08/04/27 16:21:45 ID:???
http://society6.2ch.net/test/read.cgi/gline/1193462528/461-463n

いよいよ携帯用のに手をつけますかね
あれから40個くらいミラーが増えたので実に大変なのだよ明智君

実際どうしたものかと途方にくれてるですが。
まあ手をつけられる所からやるしかないんですが。

631 :名無しさん@停滞中 ★ :08/04/27 18:33:09 ID:???
みみずんさーばー移設完了 (みみずんぶろぐ)
http://mimizun.com/blog/2008/04/post_454.html
http://qb5.2ch.net/test/read.cgi/operate/1208353361/399

うむ
反応が段違いです
すごいやすごいや

それはそうと、携帯から
http://mimizun.com/
http://122.249.88.230/
にアクセスすると携帯用ページが表示されるですが
「準備中」の表示がいつか消えるのを
金麦冷やして待ってる

632 :名無しさん@停滞中 ★ :08/04/27 19:32:03 ID:???
みみずんさんが復活されてから探してみると
>>630のリンク先のdat落ちスレッドも みみずんさんの所にありましたね。
とはいえやはり色々追加するべきかなと(>携帯用)
でも例えば
iMonaとかみたいなもの等はそれ用のスクリプトを携帯用に
また車輪の再生産しなければならないのでしょうか




それはそうと

tmkkの物置き
http://tmkk.hp.infoseek.co.jp/index.html

Macをお使いの方みたいですね。
アーカイブはtar.gz形式になってますが、Macではこの形式が汎用的なのかな。

で、下のほう

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
・2chブラウザ的Greasemonkeyスクリプト (Firefox用、Safari用)

 (中略)

  ○ DAT落ちしたスレッドを開いた時に検索ページhttp://www.geocities.jp/mirrorhenkan/index0.html
    へのリンクを表示
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

やはりMac環境でも使えているみたいですね。

あとはhtmlをdat化する方法がわかればそれでOKだろうなと。
「Python何それ食えるの」「Rubyといえば指輪だよね」
というような方々に試してもらってうまくいったら嬉しいんですが
これがどうもなかなかどうしてさてどうしたものかどうしましょう


windows/Mac/携帯のどれでも無問題になったら
それこそ本当にやる事なくなっちゃうかもですが
まだ他にもあるかな。
LinuxはWindowsから流れた方が多いでしょうし
Wineでhtmltodatが動けばいいんですがどんなものかと。
下のスレとか見ると、Janeは動いたみたいですが。

【動きます】JaneでLinuxを使ってみよう【起動確認】
http://jane.s28.xrea.com/test/read.cgi/bbs/1173371571/


あと何だろうなー
WiiとかXBOXとかPS2とかなのかな

633 :名無しさん@停滞中 ★ :08/04/27 21:53:25 ID:???
車輪の再生産→車輪の再発明


あったあった

今夜も Wine で乾杯! - 12本目
http://pc11.2ch.net/test/read.cgi/linux/1206139518/116-118n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
116 名前:login:Penguin[sage] 投稿日:2008/04/19(土) 16:30:53 ID:W4ZaPxsw
jnae doe style使えるんだけど日本語でスレ検索するとエラーで開けないのは仕様なのかな?

117 名前:login:Penguin[sage] 投稿日:2008/04/19(土) 17:02:42 ID:Hhj580oz
JaneDoeStyleはIEコンポーネントを使ってないという触れ込みだが実際はIEs4Linuxが必要だし、
自分の環境だけかもしれないが無限ループっぽいフリーズするし、
画像ビューアの表示が変だしでWineだといまいち

Wineで使うならJaneDoeViewが素直に使えて良いよ
日本語検索もmigemoも問題無く使える

118 名前:login:Penguin[sage] 投稿日:2008/04/19(土) 17:45:26 ID:W4ZaPxsw
>>117
d
やってみます
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


htmltodatはWine上で実行可能なのでしょうか
と一応書いてみる

http://society6.2ch.net/test/read.cgi/gline/1165245437/400

634 :名無しさん@停滞中 ★ :08/04/28 23:37:45 ID:???
メモ

http://popchat.nu/users/mirrorhenkan/7.pop
http://popchat.nu/cgi-bin/nph-p.cgi?mirrorhenkan
http://popchat.nu/users/f.js
http://popchat.nu/users/mirrorhenkan/s.css

635 :名無しさん@停滞中 ★ :08/04/29 09:09:23 ID:???
http://popchat.nu/users/mirrorhenkan/iframe.js
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
var popchatID = 'mirrorhenkan';
var popHeight = '150';
if (!popWidth) var popWidth = '600';
document.write('<TABLE BORDER=1 CELLSPACING=0 CELLPADDING=0 WIDTH=' + popWidth + '><TR><TD>');
document.write('<IFRAME HEIGHT=' + popHeight + ' WIDTH=100% SRC=http://popchat.nu/cgi-bin/nph-start.cgi?' + popchatID + '>');
document.write('</IFRAME></TD></TR></TABLE>');
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

http://popchat.nu/cgi-bin/nph-start.cgi?mirrorhenkan
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
<HTML><HEAD><TITLE>2ch DAT落ちスレ ミラー変換機</TITLE>
<BASE HREF="http://popchat.nu/"></HEAD>
<FRAMESET ROWS="100%,*" BORDER=0 FRAMEBORDER=0 FRAMESPACING=0>

<FRAMESET ROWS="2,*" BORDER=0 FRAMEBORDER=0 FRAMESPACING=0>
<FRAME NAME="c_top" SRC="./users/mirrorhenkan/bg.html" SCROLLING="NO" NORESIZE MARGINWIDTH=0 MARGINHEIGHT=0>
<FRAMESET COLS="2,*,2" BORDER=0 FRAMEBORDER=0 FRAMESPACING=0>
<FRAME NAME="c_left" SRC="./users/mirrorhenkan/bg.html" SCROLLING="NO" NORESIZE MARGINWIDTH=0 MARGINHEIGHT=0>

<FRAMESET ROWS="*,24,15" BORDER=0 FRAMEBORDER=0 FRAMESPACING=0>
<FRAME NAME="chat" SRC="./users/mirrorhenkan/7.pop" FRAMEBORDER=1 SCROLLING="NO" NORESIZE MARGINWIDTH=0 MARGINHEIGHT=0>
<FRAME NAME="form" SRC="./users/mirrorhenkan/form.html" SCROLLING="NO" NORESIZE MARGINWIDTH=0 MARGINHEIGHT=0>
<FRAMESET COLS="*,140" BORDER=0 FRAMEBORDER=0 FRAMESPACING=0>
<FRAME NAME="popstatus" SRC="./users/mirrorhenkan/status.html" FRAMEBORDER=0 SCROLLING="NO" NORESIZE MARGINWIDTH=0 MARGINHEIGHT=0>
<FRAME NAME="banner" SRC="./cgi-bin/ads.cgi?id=mirrorhenkan&ct=0&bc=F0F0F0&tc=333333&st=1" SCROLLING="NO" NORESIZE MARGINWIDTH=0 MARGINHEIGHT=0></FRAMESET></FRAMESET>
<FRAME NAME="c_right" SRC="./users/mirrorhenkan/bg.html" SCROLLING="NO" NORESIZE MARGINWIDTH=0 MARGINHEIGHT=0></FRAMESET></FRAMESET>

<FRAME NAME="gate" SRC="gate.html" NORESIZE></FRAMESET></HTML>
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

http://popchat.nu/users/mirrorhenkan/status.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
<HTML><HEAD><TITLE>popchat.nu</TITLE>
<STYLE TYPE="text/css">
<!--
INPUT {
position:absolute;
top:0px;
left:1px;
background-color:transparent;
color:#333333;
height:15px;
width:100%;
font-size:12px;
border:0px
}
-->
</STYLE>
<SCRIPT LANGUAGE="JavaScript">
<!--
defaultStatus=' ';
// -->
</SCRIPT>
</HEAD>
<BODY BGCOLOR="#F0F0F0" oncontextmenu="return false;">
<FORM><INPUT TYPE="text" onFocus="document.forms[0].elements[0].blur();"></FORM>
</BODY></HTML>
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

636 :名無しさん@停滞中 ★ :08/04/29 19:51:25 ID:???
http://society6.2ch.net/test/read.cgi/gline/1165245437/578-581n

超長文を投稿してしまった
他所だと叩かれるだけだろうなと思ったので其方に投稿した
反省してはいないが 無反応でもしょうがなかろうと思っている
あと「〜まで読んだ」みたいな一行レスがあっても
まあそんなもんだろうなと

637 :名無しさん@停滞中 ★ :08/04/30 21:25:46 ID:???
携帯用ミラーURLについて覚え書き

(1)携帯専用ページ存在
・2ch-i
・讃岐メニュー
・暇つぶし2ch
・nikaさんの所
・デスクトップ2ch
・23ch.info
・べっかんこ
・公式p2

(2)datアクセス可能
・みみずん検索
・syoboon
・wannabe
・takatyan
・オカルティカレーマニア
・heiwaboke
・W2Ch中間サーバ
・2ch_cache
・モナメント

(3)PC用ミラーのみ
・snapshot
・みみずん検索(一部)
・remix2ch
・Jane touch
・ムッハー

(4)特殊
・iMona中間サーバ



やっつけで書いてるんで漏れその他あるかも。
makimo.toさんの所とか今どうなっておられるのかなとか。



それぞれについて考えると

(1)そのままURL変換すれば良さそう。
(2)携帯用dat2html.phpl経由でのURLにすればいいのかな
(3)ファイルシークやgoogle携帯プロキシ経由にすればいいのかな
(4)専用の携帯用iMona.phpを作ればいいのかな


ここで少し問題なんですが
DinoSwiftさんの所と2chcacheさんの所の二つの所のミラーURLですが
元スレのURLだけでは出来ないという事で。

まあ作ってしまえばいいだけの話なんですが
imonaと共に 何とも億劫だな。。
phpの書き方からまた思い出さなければならないですし。

638 :名無しさん@停滞中 ★ :08/04/30 21:33:21 ID:???
確認メモ
携帯からどう見えるか

http://p2.chbox.jp/read.php?url=http://society6.2ch.net/test/read.cgi/gline/1165245437/
http://p2.2ch.net/p2/read.php?url=http://society6.2ch.net/test/read.cgi/gline/1165245437/

639 :名無しさん@停滞中 ★ :08/05/01 19:34:05 ID:???
URL直飛びでやってみると
snapshotはc-others.2ch.netのクラシックメニュー
公式p2はそのまま読めたかもしれないです
でも確かかどうかわかんない



さて
いろいろ見てみたら
下のスレッドが優しい方が多いように見えましたので
教えて頂けるかもしれないと思い 書き込んでみたです

くだすれPython(超初心者用)
http://pc11.2ch.net/test/read.cgi/tech/1207878910/133

無反応ならともかく、煽られたりしたらどうしましょうか。
まあそんなもんさと自分に思い聞かせるしかないですか。

もし無反応だったらどうしましょうか。

mirrorhenkanのトップページで訊いてみますかね。
popchatを見てみると 今現在60人接続者がいるみたいですし
全然接点のない別分野の方が反応してくれるかもですし。

640 :名無しさん@停滞中 ★ :08/05/02 18:53:21 ID:???
休みって何それおいしいのそうよおいしいのよ
まあ無縁ですが

疲れちゃったので簡単に


http://123.225.123.197/memo.htm

ありがとうございますです。
では要望というか独り言を

xrea.comもアクセス遮断対象から除外して頂けると嬉しいです(私が)
下記のようになりますので。

http://mirror.k2.xrea.com/dat2html/read1.php?url=http%3A%2F%2F123.225.123.197%2Ftech%2Fdat%2F1203874045.dat&btnG=%95%CF%8A%B7

いちおう手持ちのjpドメインの無料サーバだとアクセス可能ですが
取得してずーっと放置していたところなので
いきなりアクセス過多になると消滅してしまうかもなので。

http://409.jp/~szk/dat2html/i/read2.php?url=http://123.225.123.197/tech/dat/1203874045.dat&st=80&to=89#saisyo


おやすみなさい

641 :名無しさん@停滞中 ★ :08/05/03 14:35:03 ID:???
さあ連休するぞ連休するぞ
だからおらにはむえんなはなしなんだってば

という訳で
対応ありがとうございます
表示されておるです

で、懸念される問題なんですが
携帯用dat2htmlでのアクセスがどれくらいあるんだろうかと。
xreaのanalogの見方とかもあんまりよくわかんないですし。
まあやってみなけりゃわかんないですが。





あと自分用メモなんですが
何かread1.phpだと表示が変ですね。
read2.phpだと無問題ですが。

http://mirror.k2.xrea.com/dat2html/read1.php?url=http://123.225.123.197/tech/dat/1203874045.dat
http://mirror.k2.xrea.com/dat2html/read2.php?url=http://123.225.123.197/tech/dat/1203874045.dat

1番目のだとレス4の本文中でバグってるです。

1と2の違いは
単にリモートファイル取得の際にUser-AgentをMonazillaで送信するかしないかだけの違いの筈で
それ以外は何も変えてないんだけどなー。
makimo.toさんの所のファイルをdat取得して携帯用表示出来ないかという事でやってみたんですが
makimo.toさんから取得出来なくなった今となってはあんまり意味ないですなこれ。
ちなみに下記サイトのコードを使わせて頂いたのですが
php関係がフォーマットされた今の頭で読むと
暗号だぞこりゃ
さあ勉強するぞ勉強するぞと

PHP TIPS Vol.3
http://www.spencernetwork.org/memo/tips-3.php

642 :名無しさん@停滞中 ★ :08/05/03 14:41:00 ID:???
http://pc11.2ch.net/test/read.cgi/tech/1207878910/133-138n

御返事頂いたので138を書いてみたのですが
読み返すと
何だか失礼な事を書いたのかもと思い
少々自己嫌悪

643 :名無しさん@停滞中 ★ :08/05/03 14:56:56 ID:???
メモ

2ちゃんねるブラウザ
http://www.love-season.net/



これですが

http://www.love-season.net/yutori.2ch.net/news4vip/1209687609/

上のURLで

http://yutori.2ch.net/test/read.cgi/news4vip/1209687609/

がdat落ちしても閲覧可能だったら
どんなに有り難い事でしょうか。

644 :名無しさん@停滞中 ★ :08/05/03 15:58:18 ID:???
現時点では閲覧出来ないみたいです
残念



さて
>>642の関連


2ch過去ログ倉庫にあるスレッドを見たい -OKWave
http://okwave.jp/qa3924622.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
初歩的な質問ですみません。
Mac10.4.9、safari2.0.4を使っています。
2chの「このスレッドは過去ログ倉庫に格納されています」と表示される
スレッドを見たいのですが、ブラウザで見る方法を教えていただけますでしょうか。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


質問自体はともかく
下まで読んだら
いやその何というか実にまあ素っ頓狂に唐突な感じに
少しだけ驚いたりして

645 :名無しさん@停滞中 ★ :08/05/03 17:58:46 ID:???
>>1toURL
http://www.geocities.jp/hiko_bae/ichi2url.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
2chのスレッドの>>1からスレッドのURLを算出します。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


date2keyみたいなものかなとDLして見てみたです
readmeを見てみると

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
 >>1の名前と発言日時を含む1行を>>1に貼り付け、変換(&C)をクリッ
クしてください。スレッドのURLを表示します。>>1が「名無し」でない
場合や複数の板で使われている「名無し」名の場合はスレッドIDのみと
なります。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


という事は
日付からキーを
名無し名から板名をそれぞれ算出して
その日付の時の掲示板のサーバ名を割り出しているのかな。
だとしたらJavaScriptでもやれそうです。

心配になって(←?)公開日時を見てみたら
「(2006/8/23)」との事。
で、http://www.geocities.jp/mirrorhenkan/key/key2date.htmlを見てみたら
公開日時を出してないじゃないですかバカバカバカ

とりあえず前々スレ395で出したみたいで
日付を見ると「05/12/13(火) 20:13:40」 でした。
あー良かった(何が)

646 :名無しさん@停滞中 ★ :08/05/03 19:19:40 ID:???
業務連絡(カッケー!)

http://www.value-domain.com/svip.php?action=all

によると
k2.xrea.comのIPアドレスは
「210.196.176.182」固定みたいです

ところで
mirror.k2.xrea.comみたいなサブドメインの場合って
IPアドレス表示させるにはどうすればいいのでしょうか。
以前、dumper.jpさんのところがなかなか繋がらないのでIPアドレス表示させようとしたですが
2ch.dumper.jpみたいなサブドメインだったので
どうやればいいのか全然わかんなかったまま今に至るんですが。

647 :名無しさん@停滞中 ★ :08/05/03 20:01:07 ID:???
>>637続き
結果表示の順番試案

・べっかんこ(その26)
・みみずん(その6・その7・その7a)
・nikaさんの所(その20)
・23ch.info(その31)
・2ch-i(その28)
・讃岐メニュー(その24)
・暇つぶし2ch(その27)
・2ch_cache(その39)
・デスクトップ2ch(その23)


今のところこのくらいでどうかなと。
携帯用ページを用意しておられる所・ミラーが多い所を並べただけですが。
ただ あまりこういう事書いても何ですが
大抵はべっかんこで事足りるような感じがするです。

もっともらしい噂によると
ひろゆきさん べっかんこに対してダメ出しされてるそうで。
URLも何もかも違いますし(2ch.netではない)
そこの広告はひろゆきさんとは無関係とかで以下略
いやようわからんだけなんですけど

648 :名無しさん@停滞中 ★ :08/05/04 15:51:05 ID:???
くだすれPython(超初心者用)
http://pc11.2ch.net/test/read.cgi/tech/1207878910/139
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
139 ★返答 名前:デフォルトの名無しさん[sage] 投稿日:2008/05/03(土) 20:43:48

>>138
Mac板で聞けばいいんじゃね?

なんでMacを持ってない(使える環境がない)人が
検証を必要としてるのか興味あるけどね。
「問題なくできましたよ」ってレスがあれば、それを信じちゃうわけ?
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


胸がドキドキしちゃった。
これって恋?



とりあえず自分が書いた事を読み直してみましたが
139さんの「なんで〜」の件については過不足なく書いてあると思うんですが。
読解力が足りないなー。

あと何でこのスレッドで訊いたかというと
直前に
http://pc11.2ch.net/test/read.cgi/tech/1207878910/130-132n
のやりとりがあったからで。

にしても世界が狭いなー。
pythonってクロスOS言語の筈ですよね。 (だから覚えようとしてる訳で>自分)
Mac環境がないならスルーすりゃいいのに。

まあこの方がMac使いな可能性もありますが
そういう人は「Mac板で聞けばいいんじゃね?」なんて書かないでしょうし
もしそれでそういう事書いていたら実に何とも意地が悪い。

いやーこれどうするかなー。
あとレス140は自分じゃないです



そういえば、2ch-iさんのhtmlをdat化させようとした時も
最初は実に面倒なやり方しか思いつかなかったんですが
今ではまあ何とかなってますし
同様に何とかなるんじゃないかと。

http://www.geocities.jp/mirrorhenkan/2ch-i/

スクロールした下のほうに最初のやり方が残ってますが
今見ても何だかめんどくさい。
あと 新旧どちらのスクリプトもwshなので
windows限定なのが 何だかなあという感じですな

649 :名無しさん@停滞中 ★ :08/05/04 16:37:10 ID:???
http://mirror.takatyan.info/test/read.cgi/title_search_bbs/1208011907/76

とあるサイトさんとしては
「ごめんよメンフラハップ」(古)というしかないです
ごめんなさい

という事でたった今
文字を変えてみたです
これで「読めないdat」「仲間由紀恵」「熟女」「援交」等を含むスレッドが一掃されるのではないかと
しかし熟女とか一体

・・・って もう一掃されかかってる
早い

650 :名無しさん@停滞中 ★ :08/05/04 19:51:17 ID:???
粛々と>>647実装(カッケー!)
他もまあおいおいと



ところで

Peaceful japonica - プログラム
http://www.heiwaboke.net/PHP/

ここ↑の「うんかむ」って404なのでしょうか。
http://www.heiwaboke.net/m/unkam.php

651 :名無しさん@停滞中 ★ :08/05/04 20:00:35 ID:???
ところでスレ違いという事はないですが(自分で言ってどうする)
「暇つぶし何其」って実にいいですね。
他の方のブックマーク(というかチェックスレ)をあれこれ見れたり
熱いスレ一覧とかあったり。

暇つぶしwikipediaや暇つぶし青空文庫もすごいです
色々小説とか読んでみたりして

652 :名無しさん@停滞中 ★ :08/05/05 15:05:23 ID:???
携帯で色々見てみましたが(コピペとか面倒ですが仕方ない^^;)
みみずんさんの所がすっげー爆速だもんで
すごくストレスレスですね。

で、色々見ていて思ったのは
携帯用dat2htmlをもう少し改良したいかなと。

とりあえず3つくらい

(1)レスアンカーからジャンプしたい
(2)AASをちゃんと使えるように
(3)文章コピペ出来るように「写」の項目があれば


まだあるかな
どれもこれも 頭を絞れば何とかなりそうな感じがするです

653 :名無しさん@停滞中 ★ :08/05/05 17:41:43 ID:???
質問?ボコボコにしてやんよ!
http://bokoboko.dip.jp/bokoboko/

以前見た時は 他にやりたい事があるので閉鎖します とあったのですが
再開しておられるですか
クロールして現在進行中ですか
日付や時間を見るとついさっきのとかありますし

質問?ボコボコにしてやんよ! 15歳の時に子供産んだけど何か質問ある?
http://bokoboko.dip.jp/bokoboko/index.py/1209965985

てかリンクを見ると
何だかパワーアップしとるです

ブログ執筆中
http://d.hatena.ne.jp/tomity/
大学・大学院研究室検索のラボナビ
http://labnavi.sytes.net/
ラボナビ開発日記
http://d.hatena.ne.jp/lab_navi/


いやーpythonで構築したサイトの実例だなー
すごいや

654 :名無しさん@停滞中 ★ :08/05/06 09:50:07 ID:???
メモ

WisdomSoft
http://www.wisdomsoft.jp/

知らない事が多過ぎて、これからの人生わくわくするぜ。

655 :名無しさん@停滞中 ★ :08/05/06 12:01:24 ID:???
技術資料も分かり易い感じがしますし
論文フォルダの下記とか面白かったー。

未来が創られた時
http://wisdom.sakura.ne.jp/essay/pioneer/index.html


写真の有無によって全然印象が変わりますね。
偉人伝.com↓もプロフィール画像があったらいいなと

コンピュータ偉人伝 ちえの和WEBページ
http://www.ijinden.com/index.html

656 :名無しさん@停滞中 ★ :08/05/06 13:17:12 ID:???
2ちゃんエディタ
http://edit.2chmap.com/


これですが

http://edit.2chmap.com/read/yutori.2ch.net/news4vip/1210004050.dat/1

http://yutori.2ch.net/test/read.cgi/news4vip/1210004050/l50

がdat落ちしても閲覧出来ていたら
どんなにか嬉しい事でしょうか

657 :名無しさん@停滞中 ★ :08/05/06 16:09:53 ID:???
閲覧可能ですね。

では追加させて下さい
「その40」という事で


ここですが、トップの下部を見てみると

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
追加予定機能

・過去ログ
過去ログの表示対応
・携帯対応
携帯からも閲覧できるようにする
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


との事なので
dat落ち後も保存して下さったら嬉しいです。


dat化は次レスにて(まだ完全ではないですが)

658 :名無しさん@停滞中 ★ :08/05/06 16:23:10 ID:???
メモ
2ちゃんエディタ(http://edit.2chmap.com/)のdat化について

URL例
http://edit.2chmap.com/read/yutori.2ch.net/news4vip/1210004050.dat/1
http://mirror.sarashi.com/htmltodat/1210004050.html

正規表現
m#<dt><a.+?>([0-9]+)</a> ()<b.+?>(.+?)</b> 投稿日:(.+?)</dt><dd>(.+?)<br><br></dd>(<dt>|</dl>)#mik

前処理
s#(<title>)2ちゃんエディタ \[(.+?)\](</title>)#$1$2$3#ik
s#( 投稿日:.+?ID:)<a.+?>(.+?)</a>(</dt>)#$1$2$3#igk
s#<a.+?>((?:&gt;)?&gt;\d+)</a>#$1#igk
s#\n(?:ref|pop).+?(\n)#$1#igk


前処理の3つ目の「&」は半角にして下さいです


終了後に「一行が長すぎるか〜」エラーが出ますが、これでいちおうdat化出来るかと。
エラーがなかなか消えないのでソースを見てみると
全く同じ文章がポップアップ用に出力されているみたいです。
これを省くために前処理の4番目をつけてみたんですが、まだエラーが消えないなぁ・・・。
何でなんだろう。
dat化には問題ないかなとは思いますが。


あとメール欄は元のhtmlの段階から消えているみたいで(生禿さんのところみたいに)
これは我慢するしかないかも。

659 :名無しさん@停滞中 ★ :08/05/07 20:29:38 ID:???
ちょっと面白かったのでメモ

DCOSHA - Direct Connection for Override System of Hardcopy Archives
http://www4.atpages.jp/mnk/

まあいわゆるdatアップローダなんですが
実にデザインがクールだなと

で、これの元サイトのリンクを辿ってみたら
下のになってたですよ

エロ絵♀
http://haruhix.mad.buttobi.net/

660 :名無しさん@停滞中 ★ :08/05/07 23:02:28 ID:???
DinoSwiftさんいよいよ上京ですか。

頑張って下さいです

661 :昼休み@名無しさん@停滞中 ★ :08/05/08 12:52:33 ID:???
サーバPCもお休みになられたみたい



>>659ですが
http://pc11.2ch.net/test/read.cgi/hosting/1193869295/681,685,687
から知ったです

サイトを見れば見るほど
何というか 才能(技術)の無駄遣いだなーと。
いやすごいほめてるんですが。

662 :昼休み@名無しさん@停滞中 ★ :08/05/10 06:44:57 ID:???
http://popchat.nu/users/mirrorhenkan/7.pop

なことかいてどうしろと
なにかあったらきけんがあぶない
いのちがしんだらどうしてくれる

663 :名無しさん@停滞中 ★ :08/05/10 16:09:31 ID:???
ログインが必要なWebページをダウンロードするには?
http://homepage1.nifty.com/MADIA/vb/vb_bbs2/200412/200412_04120009.html
XMLhttpにてYahooにログインするには?
http://hpcgi1.nifty.com/MADIA/VBBBS2/wwwlng.cgi?print+200606/06060001.txt
XMLHttpRequestまとめ - Archiva
http://archiva.jp/web/javascript/XNLHttpRequest.html
proxyサーバーを通すインターネット接続をおこなうにな?
http://hpcgi1.nifty.com/MADIA/VBBBS/wwwlng.cgi?print+200511/05110047.txt

664 :名無しさん@停滞中 ★ :08/05/12 07:57:41 ID:???
各人ニ告グ

掲示板一覧ニ下記二板ガ【ネタ雑談】ニ追加サレタノデ、
閲覧専用機種ヲ使用ノ住人ハ速ヤカニ板一覧更新サレタシ

http://bubble6.2ch.net/dejima/ dejima
http://bubble6.2ch.net/senji/ 戦時




ところでこの二板なんですが
もしかして投稿時に

ひらがな→ローマ字
ひらがな→カタカナ

にそれぞれ変換保存とかしてるんでしょうか。
投稿テストしてみればわかりそうなもんですが。

・・と書いてから見回すと
そんな事はなさそうでした

http://bubble6.2ch.net/test/read.cgi/senji/1210161012/31

665 :名無しさん@停滞中 ★ :08/05/12 12:10:12 ID:???
戦時板だけでしたか。

試しに書いてみたら


−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

--------------------
書込み中・・・
--------------------
ERROR!
漢字とカタカナしか受け付けていません

ホスト****************************

名前: 名無シサン@ヲ腹イッパイ。
E-mail: sage
内容:
ひらがなではだめですか

★ アクセス規制中でも書ける板たち ★


こちらでリロードしてください。 GO!
アクセス規制・プロキシー制限等規制は、2ちゃんねるビューアを使うと回避できます。自分で解決してみよう! 書き込めない時の早見表
分からないことがあったら2ちゃんねるガイドへ。。。

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−



50音と濁点半濁点促音の変換くらいはサーバ側でやったらいいのになと思ったり。

666 :名無しさん@停滞中 ★ :08/05/12 12:14:48 ID:???
あと曜日も
月月火水木金金
と表示されるのか・・

667 :名無しさん@停滞中 ★ :08/05/12 18:19:11 ID:???
メモ

CGI...写メール日記
http://www.kit.hi-ho.ne.jp/t-sonoda/mobdiary/
レッツPHP!
http://php.s3.to/bbs/bbs7.php

668 :名無しさん@停滞中 ★ :08/05/13 16:44:35 ID:???
業務連絡

http://bubble6.2ch.net/dejima/ dejima

このdejima板なんですが
世界情勢カテゴリに入ったようで。


書き込もうとすると

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
--------------------
書込み中・・・
--------------------
ERROR!
日本語は受け付けていません

ホスト**************************

名前: maji
E-mail: sage
内容:


★ アクセス規制中でも書ける板たち ★


こちらでリロードしてください。 GO!
アクセス規制・プロキシー制限等規制は、2ちゃんねるビューアを使うと回避できます。自分で解決してみよう! 書き込めない時の早見表
分からないことがあったら2ちゃんねるガイドへ。。。

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−



ひらがなカタカナ漢字はいけないんだそうな。
だったらUTF-8にして欲しかったかも。



ところで戦時板ですが
同様の事とか0chですっげー簡単に出来ますね。
更にdatの平仮名をhtml表示時にカタカナにする事とかも
jcode.pl/Jcode.pmのどちらかを使えばあっけなく出来るのでは。
0chを見てみるとmoduleフォルダ内にjcode.plがあるんで
valda.plとgaladriel.plあとread.cgiの該当個所を変えれば良さそう。
例えば下のを参考に


require "./jcode.pl";
$line = "あいうえお\n";
&jcode::tr(\$line, 'あ-ん', 'ア-ン');
print $line;


メモ

jcode.pl official page
http://srekcah.org/jcode/

669 :名無しさん@停滞中 ★ :08/05/13 20:48:49 ID:???
テナ訳デ
突貫工事デ
ヤッテミタ

戦時@0ch掲示板
http://mirrorhenkan.hp.infoseek.co.jp/senji/cgi-bin/senji/

やっつけなのであちこち適当だもんで
本当は書き込み確認や各種エラーもカタカナ化しようと思ったですが
まあいいやと。

表示をjcode.plでひらがな→カタカナ変換してるだけなので
datにある文章はひらがな混じりになっておるです。
書き込み時にもひらがなをカタカナ化しようかなと思ったですが
まあいいやと。

670 :名無しさん@停滞中 ★ :08/05/13 21:02:58 ID:???
ところでjcode.plでのひらがな→カタカナ変換なんですが
呈示されていたサンプル

&jcode::tr(\$line, 'あ-ん', 'ア-ン');

これだと、例えば

「あなたのおじい様の戦争体験を教えて」



「アンンンンンん様ン戦争体験ン教んん」

と変換されてしまったです。

あちこち検索してみたですけど、どうやったらいいのかわからない。
仕方なく

&jcode::tr(\$line, 'あいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろわをんがぎぐげござじずぜぞだぢづでどばびぶべぼぱぴぷぺぽぁぃぅぇぉゃゅょっ',
'アイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワヲンガギグゲゴザジズゼゾダヂヅデドバビブベボパピプペポァィゥェォャュョッ');

とやったです(長すぎるので改行してます)
意味ないなー。


「A-Za-z」みたいには出来ないんでしょうか。
そんな事はないと思うんですが・・・。

671 :名無しさん@停滞中 ★ :08/05/14 12:41:12 ID:???
>>670の件
たぶんこれが原因なのかも

jcode.pl の私的な解説書
http://mikeneko.creator.club.ne.jp/~lab/kcode/jcode.html#h2-10
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
「-」による範囲指定は、$line の文字コード及びスクリプト自身が、JIS か EUC でなければなりません。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


変換しようとしている文字コードがShift_Jisだからなのであろうか。
もしこれがビンゴだとしたらまあお恥ずかしい事で。


で、もし更にあきらめずにこの方法でやるとしたら
下のが参考になるかも。

http://usamimi.info/~mirrorhenkan/2ch/perl/php/read.php/1022731565/196-204n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
'ァ-ン', 'ぁ-ん'をEUC-JPの文字コードで書けばいいんじゃない?
&jcode'tr(*s, "\xHH\xHH-\xHH\xHH", "\xHH\xHH-\xHH\xHH");
HHのとこは16進の文字コードで。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

ただし、199でやっておられるように
いったんShift_JisをEUCまたはJISに変換してからやんないといけないみたいなんで

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
&jcode'sjis2euc(*ss);
&jcode'tr(*s, "\xHH\xHH-\xHH\xHH", "\xHH\xHH-\xHH\xHH");
&jcode'euc2sjis(*ss);
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

というようにせねばならぬようで。
結局>>670で自分的にはよさそうだ。

672 :名無しさん@停滞中 ★ :08/05/14 20:00:16 ID:???
さて

拡張子binのMacバイナリアーカイブを解凍して中のテキストを見たいのだが、
Aladdin Expanderがレジストリや関連づけをいじるみたいで。 
少なくともzipの関連付けをこのソフトに変えるみたいですし
Macでのzipはこれまたwinとは様相がかなり違う予感。
そういえばMacバイナリの2バイトゴミを除去するソフトとかあったっけなと



という訳で
マカーはいねがー!? 
DL解凍してwinでも開けるような形式にして頂けたら嬉しいのです(私が)


ちなみにファイルは
http://www.vector.co.jp/soft/mac/writing/se036415.html
であり
決して怪しいものではありません。

673 :名無しさん@停滞中 ★ :08/05/14 20:21:35 ID:???
メモ

丸谷君の遺言
http://hp.vector.co.jp/authors/VA005156/
むだじゃ、むだじゃ
http://hp.vector.co.jp/authors/VA022533/
「正(旧)仮名遣ひ⇔現代(新)仮名遣い」相互変換〜まるやるま君
http://hp.vector.co.jp/authors/VA022533/tate/komono/Maruyaruma.html#pos
misima 旧仮名遣い・旧字変換支援
http://yasuda.homeip.net/misima/misima.html
みんなの知識【ちょっと便利帳】 - 旧字体(旧漢字)と新字体(新漢字)の相互変換
http://www.benricho.org/moji_conv/13.html
はてなブックマーク - 男だってバラが好き: 旧字体、正字変換用データ
http://b.hatena.ne.jp/entry/3591857
はてなブックマーク - FeZn/Sinfonia / 旧字体変換
http://b.hatena.ne.jp/FeZn/%E6%97%A7%E5%AD%97%E4%BD%93%E5%A4%89%E6%8F%9B/
漢字ピンイン変換
http://www.lib.hit-u.ac.jp/~ono/pinyin.html
Text Converter drpl
http://www.yk.rim.or.jp/~tomoto/archives/drpl/



>>672ですが、作者さんのブログが現役なので
作者さんにお願いするという方法もありますが
もんのすんごい勇気と努力と精神力が必要になるです
ぐああ

帝國ニュウス電信
http://ameblo.jp/bap

674 :名無しさん@停滞中 ★ :08/05/14 20:35:44 ID:???
因に何を遣り度いのかと言ふと
0chで舊假名遣ひ及び正字體變換するやうな物が出來たら面白いなと云ふ事で。
原理的には繪文字變換とさう變はらないんぢやないかなと。

勿論、正確にやらうとすると
形態素解析やマルコフ連鎖のやうな頭痛が痛くなるやうな勉強が必要でせうけど、
まあ其処まではハハハ。



てかさう云ふのも面白いぢやないですか。
下のとか讀ませて戴くといやー實に興味深い。

phaのニート日記
http://d.hatena.ne.jp/pha/

675 :名無しさん@停滞中 ★ :08/05/14 21:18:24 ID:???
日本語の改革
http://www.geocities.jp/kokuminbunka_3776/japanese.html

676 :名無しさん@停滞中 ★ :08/05/15 18:29:00 ID:???
取り敢へずやつてみましたがどうでせうか。
途中經過

ttp://mirrorhenkan.hp.infoseek.co.jp/meiji/cgi-bin/test/read.cgi/meiji/1025000169/l50

適當な箇所をピックアップ

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
982 :名無し三等兵:02/11/06 23:32 ID:l/FMz7Y5
親父の爺ちゃんはどこに所屬してゐたか忘れたが滿洲に居たさうだ。日本が壱番景氣の
良い時に行つて惡くなる直前に徴兵滿期で實家に歸つたさうだ。本人は『炊事軍曹』
とか言われてゐたらしい。終戰後、暫くして『また滿洲行きてぇなぁ』とか言つて家蔟全員から
『それは無理だつて』とか突込みを受けた摸樣。詳しくは判らないが滿洲で相當いい思いを
して來たと思われる。自分が小學棲の時に屍んでしまつたが。
母方の祖父は終戰時暢嵜の近くの工場で竹と木で出來た蜚行機を作つてゐて『これじゃ日本は
負けるな』と思つたさうだ。暢嵜の原爆のきのこ雲も目撃して、後片附けにもいつたさうだ。
此方も既に鬼籍にはいつてしまつてゐるが。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

「長嵜」(新字で云ふと「長崎」)が「暢嵜」と誤變換されてゐますが
其れ以外は結構上手くいつてるんぢやないかなと

只、やつてみて思つたですが
矢張り單なる置き換えだけでは限界がありますね。
前後の女子もとい助詞及び副詞の各活用形もですし
變格活用即ちサ變ラ變等の特殊型も考慮せねばならぬ。
いやー面白いなーワクワクするぜ。


さう言へば 主觀的時間が實に緩やかに流れてゐた頃に百人一首を覺えたものでしたが
お陰で古文の文法は適當にやつて何とか成つたもんだつたつけなと。
此れでは如何と理詰めで覺えていつたら泥沼状態のチンプンカンプンになつちやつて
現在に至るんですが。



百人一首の中でも特に好きな歌。
情景が浮かんでくるやうに思ひませんか?

君が爲春の野に出て若菜摘む我が衣手に雪は降りつつ

677 :名無しさん@停滞中 ★ :08/05/15 18:50:20 ID:???
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
504 :名無し三等兵:02/08/25 00:33 ID:Kzrj+qr/
母方のじいさんは、中國で戰つてゐたらしい。
あまりよく話は聞けなかつたけど、砲兵部隊にゐたらしく
そのせいで難聽になつたさうだ。
空襲に來た敵機を塹壕から野戰砲(砲兵に野戰砲つて、正しいのかは分かりません。ご容赦ください)
で偶然にも撃ち落としたら、次の日から倍以上の敵機が襲つてきたらしい。
あるときマラリアにかかつて、軍醫にも抛つて置かれたが軍醫のところまで這つて行つて
必屍で頼んで治療してもらつた。
しかし、そのおかげで最前綫で戰わなくてすんで棲きて歸つてこられた。
復員してきても、戰場での經驗はトラウマになつたらしく、漏れが中學になつた頃でも夜中にうなされて
叫んで蜚び起きることがあつたさうだ。
そのじいさんも、漏れが嵩3の時に亡くなつた。
亡くなる前に病院のベッドの上で、もう意識が無いのに苦しそうなうめき聲をあげたことがあつた。
よっぽど苦しいことだつたんだと、改めて思つた。
じいさん、安らかに。ばあさんも、暢棲きしてな。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


どうも「長生き」の變換が變ですね。「暢棲き」になってら。

長→暢(チョウ)
生→棲(セイ)

と機械的に變換されてるみたいです。
>>673のJavaScriptを參考にして判る範圍でperlに入れてみたんですが
前後關係で元に戻してゐる箇所のうちの一つが此れみたい。


然し何と云ふか歴史的假名遣ひつて臨場感があるやうに思ふですが
自分だけでせうか。

暫くかう云ふ文章で書いてみますかね。
其の内飽きるでせうけど。

678 :名無しさん@停滞中 ★ :08/05/15 19:14:17 ID:???
接続元別アクセス1日統計
http://123.225.123.197/accessIP.htm

どうも自分と此の携帶用dat2html經由で
750アクセス191メガバイトの轉送量があるみたいで
何だか御免なさい

みみずんさんの所とかもつとあるんでせうけど
一體どれくらゐなのでせうか。
てか 携帶用ページが一刻も速く公開されるのを
金麥冷やして待つてる

679 :名無しさん@勉強中 :08/05/15 23:36:25 ID:SFRx6ZXl
>672のものを解凍して、Mac以外では不要なリソースフォークを削除して、
lhaで圧縮したものをご用意しました。
ご入り用でしたら返信願います。

680 :名無しさん@停滞中 ★ :08/05/16 07:21:12 ID:???
おはようございます
出掛けに取り急ぎ

>>679さん
おお!ありがとうございます!
是非お願い致します。

681 :名無しさん@停滞中 ★ :08/05/16 12:21:49 ID:???
メモ

歴史的仮名遣ひ教室
http://www32.ocn.ne.jp/~gaido/kana/index.htm
正字正假名遣ひの爲のリンク集(一覽)
http://www.hat.hi-ho.ne.jp/funaoto/link/link.html

682 :名無しさん@停滞中 ★ :08/05/16 16:24:10 ID:???
下の記事を見てみると
MacOS Xっていいじゃないですか。

プログラマーを引き付けるMac OS Xの魅力 − @IT
http://www.atmarkit.co.jp/flinux/special/mac/macosxa.html

683 :名無しさん@停滞中 ★ :08/05/16 18:36:26 ID:???
いろいろ見ていると
間違った仮名遣いを使っているかもと不安になりますね。

旧仮名づかひでレスしたまへ。
http://academy6.2ch.net/test/read.cgi/kobun/1015845434/
★★★★舊字、舊假名遣ひで話すスレッド 四箇目
http://academy4.2ch.net/test/read.cgi/gengo/1092597931/


ところで「舊」で検索したら
makimo.toさんの所では幾つか出るのですが

29ch - 【検索】キーワード「舊」を探しました
http://makimo.to:8000/cgi-bin/search/search.cgi?q=%E4p&andor=AND&sf=2&H=&view=table&all=on&shw=

takatyanさんの所では一つも出てこないです
何でなんでしょう

2ちゃんねる過去ログスレタイ検索
http://mirror.takatyan.info/title_search/title_search.cgi?query=%E4p&query_host=&query_board=&res_min=0&res_max=0&key_min=0&key_max=0&sort=score&hana=mogera

684 :名無しさん@勉強中 :08/05/16 19:02:20 ID:KLZgAJj8
>>683
それは検索処理方法によるものです。
確かに、完全一致検索では0件、との結果が得られます。

それは、「舊」なる単語を含むスレッドは確かに一つもないためです。
「舊字」を完全一致検索で検索をするといくつか出てきますが、
これらは「舊」なる単語を含むわけではないので「舊」で検索しても出てきません。

恐らく、単語とか関係なく、ただ「舊」なる文字を含むスレッドを探したかったのでしょうと推測いたします。
そのような場合には部分一致検索をご利用ください。多少お時間を頂戴しますが、お望みの結果となります。

上記のような単語ベースの検索になっているのは、
例えば「京都」で検索したときに「東京都」が出てくる、などという現象を防ぐため、
及び高速化のためです。

・・・検索結果数に応じて自動的に完全・部分一致などを切り替えるようにしたほうがいいかもしれませんね。

685 :名無しさん@停滞中 ★ :08/05/16 19:53:37 ID:???
>>684
おお、そういう事でしたか。
いつもお世話になっておりますです

という訳で、検索処理方式も選ぶものをつけさせて頂いたです
あとは板名入力ボックスもつけてみるですか

というか
何だかごめんなさい
日々反省の毎日です

686 :名無しさん@勉強中 :08/05/16 20:42:13 ID:KLZgAJj8
>>685
>>684
> ・・・検索結果数に応じて自動的に完全・部分一致などを切り替えるようにしたほうがいいかもしれませんね。
を実装しておきました。

ですが具体的にどういうときにどう切り替わるのかは良く判りません。
なんとなーく、完全一致で検索して何もないと部分一致に切り替わるとかそういうのだと思います。

687 :名無しさん@勉強中 :08/05/16 23:03:43 ID:HoF9RAbp
>>678 どうも 123.225.123.197の管理人です

1日 750アクセス程度なら気にする程でもないかと思います。
iriaで自鯖にアタック掛けてみましたが、毎秒10ファイル位は処理
出来たのでまだ余裕かと‥
プロバイダもトラフィック管理とか、ちゃんやっているのか
いまいち‥?なOCNを使っているので大丈夫?だと思います。

688 :679:08/05/17 09:46:25 ID:VTJcRomI
>680
下記にアップロードしました。
http://ranobe.com/up/src/up273052.lzh

689 :名無しさん@停滞中 ★ :08/05/17 17:40:32 ID:???
土曜って何それおいしいのそうよとてもおいしいのよ
土曜って平日ですよね



>>686
追随させて頂きましたです。ついでに板名選択ボックスもつけてみたりして

ところで、検索結果ページのtitleタグに検索ワードが含まれていたら嬉しいかもです
「何の単語で検索したんだっけ」という時がありますし(って自分だけ)
あとタイトルに検索ワードが含まれていたらブラウザの履歴一覧で検索した単語が判りますし。


>>687
どうもです。お気を遣って頂いて感謝です

そういえばみみずんさん
転送量の関係でプロバイダ変更されたそうですね

http://qb5.2ch.net/test/read.cgi/operate/1210140086/322


>>688
ありがとうございます。感謝感謝です
ばっちり解凍閲覧出来ていますです

しかしすごい力技のデータベースだな・・。

690 :名無しさん@勉強中 :08/05/17 17:53:08 ID:tdaTGfYX
>>689
> ところで、検索結果ページのtitleタグに検索ワードが含まれていたら嬉しいかもです
実装しました

691 :名無しさん@停滞中 ★ :08/05/17 19:26:39 ID:???
早っ
どうもです




メモ

JavaScript で形態素解析もどき - エブログ
http://ablog.seesaa.net/article/20969848.html
マルコフ連鎖で文章生成(JavaScript) - エブログ
http://ablog.seesaa.net/article/20987336.html
JavaScript で人工無脳 マルコフ連鎖で返答 - エブログ
http://ablog.seesaa.net/article/21513007.html

692 :名無しさん@停滞中 ★ :08/05/17 20:19:05 ID:???
読めるようにして頂いた>>672のデータを見ているんですが
これ本当にすごいですね。
品詞とか助詞とか何も考えずに
機械的に全置換すれば歴史的仮名遣いになってしまうみたい

ただ、10890種類もの置換文をgスイッチで行うというのは
どう考えてもサーバ負荷が甚大っぽい。
というか 試しに1000個くらいやってみたら
サーバエラーになったです。
500くらいに減らしたらOKになったので、過負荷が原因なんだろうなと。
勿論「表」や「能」みたいなダメ文字はエスケープしてやってみたですが。

てか
ダメ文字って正字に多いですね。






































x
x
\
\

693 :名無しさん@停滞中 ★ :08/05/17 20:43:37 ID:???
うーむ

漢字変換のほうはなんとかなりそうですが
送り仮名等の変化がどうも。

やはり品詞解析や各活用形を解釈して変換させるほうが
遠回りのように見えて実は近道なのかな

694 :名無しさん@停滞中 ★ :08/05/18 09:07:00 ID:???
http://academy6.2ch.net/test/read.cgi/kobun/1015845434/66
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
66 名前:名無氏物語[] 投稿日:04/09/29(水) 21:17:35 ID:08QD583M
(オリムピツク板に此のやうなスレがありました)

1 名前:クーベルタン男爵さん 投稿日:04/09/01 00:11
昨日の閉會式にも姿を見せなかつたやうだが。
やはり日本人にはマラソン競技は無理なのだらうか。

21 名前:クーベルタン男爵さん 投稿日:04/09/08 20:26
>>20
朝鮮は今は日本の領土なのですが。。。
ところで、朝鮮には孫基禎君と云ふ將來有望な少年がゐるさうですよ。
聲を掛けてみてはいかがでせう?

32 名前:クーベルタン男爵さん 投稿日:04/09/18 11:28:32
>>31
竹取物語でもあるまひし、人類が月に逝くなどあるものか。
其れより、歐州の戰爭が世界大戰とも云へる様相を呈して來たことで、
1916年に豫定してゐた伯林オリムピツク大會の開催が危ういさうだよ。
金栗にはストツクホルム大會の雪辱を果たして欲しかつたのだが。

33 名前:弐拾六 投稿日:04/09/18 13:11:22
>‎>参拾弐殿
人が月へ往くのと、我が帝都でオリムピツクが開催されるのは、
どちらが先でせうか。

34 名前:クーベルタン男爵さん 投稿日:04/09/20 18:15:16
>>33
あるひは月に行く方が先となるやも知れませぬ。
近ごろ獨逸で發明されたと云ふロケツトは、將來は月への到達も考へてゐるさうです。

それに對して、オリムピツクで日本がメダルを取るのさへ夢物語の現状では、
帝都での開催などあらう筈も無いではありませぬか。
日本が金メダルを1つでも取る時代が來れば別ですが、まず考へられませぬ。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−



URLを書いて下さいです
読みたくても読めませぬ

とりあえずレス1の日付からキーを推測するに
2004/09/01 00:11:00〜2004/09/01 00:11:59の間に立てられたものと思われるので
キーは1093965060〜1093965119のどれかなのかなと。
60回ググるのも悲しいので該当過去ログ倉庫を推定すると
名無し名からオリンピック板であり
日時からhttp://sports7.2ch.net/olympic/kako/o1093/のどれかではなかろうかと。

で、この中には当キーの範囲のスレッドがなさそう。
残念ながらここまでかな

695 :名無しさん@停滞中 ★ :08/05/21 18:48:54 ID:???
http://2c.ath.cx/memo.htm

追随させて頂きましたです

というか
追随させて頂いた途端にIPが変わったのですか。

http://124.87.104.56/

696 :名無しさん@停滞中 ★ :08/05/21 19:15:05 ID:???
ところでnikaさんの所が繋がらないとの事でしたが
繋がったので良かったです

そういえばデスクトップ2chさんの所も長い事ダウンしてたですが
復活なさいましたし
makimo.toさんのスレタイ検索が復活した時は狂喜乱舞したっけだなーと

DinoSwiftさんも落ち着いたら再稼働して下さるでしょうし
前途洋々です
未来は明るい
ビバ21世紀


それと
dumper.jpさんの所も
いつか再開なさる事をいつまでも待ってる
googleページランクやはてなブックマークを追加されたり
レスアンカーポップアップやID抽出もつけられた矢先に閲覧出来なくなった感じなので。
例えば下記スレとか

コーラを自分で作りたい - 2ちゃんねるみらー
http://web.archive.org/web/20070107152447/2ch.dumper.jp/0000103506/

697 :名無しさん@停滞中 ★ :08/05/21 19:24:13 ID:???
ところで見ておられる方で余裕がある方に見て頂きたいのですが

(1)ルクダルさんの所と
(2)2chdat.netさんの所と
(3)dumper.jpさんの所の

webarchiveに残っているURLを集めてみたのですが
URLはそれぞれ下記

(1) http://mirror.sarashi.com/webarchive/ruku.txt
(2) http://mirror.sarashi.com/webarchive/2chpop.txt
(3) http://mirror.sarashi.com/webarchive/dumper.txt

このうち
(1)(2)はURLに元スレッドの9or10桁のキーがあるので元スレの類推が可能なのですが
(3)のdumper.jpさんのミラーではそれが全くわからないです。
>>696のwebarchiveだと開いて「最新」の箇所に
http://web.archive.org/web/20070107152447/http://food6.2ch.net/test/read.cgi/juice/1041091682/
とあるのでやっと判るという程度で。
元スレとの突き合わせをしないとどうにもならない。

1000スレッドくらいあるみたいなんですが
何方かやって頂けないでしょうか。

698 :名無しさん@停滞中 ★ :08/05/22 19:01:53 ID:???
どうも百度掲示板が中国版2ch状態になっているみたいで。


【2ch】ネタちゃんねる m9( ゚д゚)っ 中国の掲示板の書き込みを訳したら、おまいらそっくりだった
http://2channel2.blog32.fc2.com/blog-entry-55.html
中国の大規模掲示板の書き込みを訳してみた - 大陸浪人のススメ 〜迷宮旅社別館〜
http://blog.goo.ne.jp/dongyingwenren/e/f21f241f0c7d925bd458e70f549f7993



という訳で
例えば下記スレッド等をdat化してみたりしたら面白いかも。

百度_地震?_祝日本救援?平安!都来?
http://tieba.baidu.com/f?kz=379156270

文字コードはgb2312ですがJaneNidaでは非公式にサポートしておられるそうなので
まあ無問題。

問題は、gb2312だとhtmltodat.phpでは認識してくれなさそうな事で。
ちょっと心気を澄ます余裕が無いのでひとまずメモ



CJCODE v1.00
http://bjkoro.net/download/cjcode/
多言語CGIダウンロード
http://bjkoro.net/download/index.php?mode=open&cate=4&no=34
中国語の文字コード
http://ash.jp/code/code_zh.htm


ところで上のcjcode.plなんですが
以前DLして色々試してみたらどうも繁体字変換出来なくてかなりてこずったです。
で、コードを追っていったら
単に作者さん 変数名を間違っておられるだけみたい。

× bgi5 → ○ big5

とか変えてみたら動いたです
サポート掲示板を見ても全然その事が書いてなかったので不思議に思ったっけでした
って記憶を頼りに書いてるので此方が間違っているかもですが。

699 :名無しさん@停滞中 ★ :08/05/23 18:46:36 ID:???
とりあえずhtmlの村下孝蔵を把握せねば話にならぬ

百度_凉宮春日《分裂》??地点求助??
http://tieba.baidu.com/f?kz=190540976
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
<table width="72%" border="0" bgcolor="#FFFFFF">
<tr>
<td height="17" align="center" width="3%" class="gray">1</td>
<td class="p14" align=left >
<a name="1774431698"></a>

<font color=#0000cc>《分裂》??地点求助?? </font>

</td></tr>
<tr><td></td>
<td align=left width="97%" >
<table class="wr" border="0" cellspacing="0" cellpadding="0"><tr><td class="gray14">

<cc>?...
<br>不??来自何方,只要是?找不到?《分裂》的地点就?迎在此求助。
<br>不??来自何方,只要是知道能?到《分裂》的地点就?迎在此回答。</cc>

</td></tr></table>
</td></tr>
<tr><td height="17"></td><td class="p14"></td></tr>
<tr><td height="17"></td>
<td align=left >作者: <a href="http://passport.baidu.com/?detail&aid=6&default_tab=1&un
=%9B%F6%8Cm%A5%CF%A5%EB%A5%D2%A4%CE%9B%E6" target=_blank> 涼宮ハルヒの涙</
a> <a href="http://hi.baidu.com/suzumiya%5Ftear" target="_blank"><img src="http
://img.baidu.com/passport/space_open.gif" border="0" align="absmiddle"></a>&nbsp;



<font class="gray12"> 2007-4-13 14:04 </font> 
<a href="#sub" class=t onclick="ResetReplyTitle('1','《分裂》??地点求助?? ');">回?此?言</a>  


</td></tr>

<tr><td></td><td><hr align=left width="87%" size=1 >
</td>
</tr></table><a name="#2"></a>
<table width="72%" border="0" bgcolor="#FFFFFF">
<tr>
<td height="17" align="center" width="3%" class="gray">2</td>
<td class="p14" align=left >
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


一レス一レステーブルタグで閉じてるみたい。


ところで、簡体フォントは??になるので
同じ文章を0chUTF8化の板に貼ろうとしたら「NGワードが含まれてます」と出たですが
キャップ付きでもNGワードが含まれていたら投稿出来ないのかな。

700 :名無しさん@停滞中 ★ :08/05/23 18:59:25 ID:???
メモ

PHP: html_entity_decode - Manual
http://php.benscom.com/manual/ja/function.html-entity-decode.php
「環境」の検索結果 - 猫(=・ω・=)顔 1.0β
http://d.hatena.ne.jp/nyagao/searchdiary?word=%B4%C4%B6%AD


ところで

Twitterたのしーよ@むたぐち の てづくりぶろぐ
http://winscript.jp/blog/diary.asp?id=5

を拝見したのでtwitterなるものを始めてみたのですが
適当にFollowして頂いても頂かなくても。

http://twitter.com/mirrorhenkan/



で、>>698の件をお聞き(というか独り言)してみたら
nishioさんからpythonでのやり方を教えて頂いたのでとても感激したです
・・・凄い人だな。

http://twitter.com/nishio/

701 :名無しさん@停滞中 ★ :08/05/24 20:32:09 ID:???
なかなか難しいものだ

encode, decodeのおさらい - ヒトヲノロワバ アナフタツ ニッキ
http://d.hatena.ne.jp/shrkw/20071129/1196353733
Python で日本語を扱う基本をまとめてみるメモ(その2) - 猫(=・ω・=)顔 1.0β
http://d.hatena.ne.jp/nyagao/20070808/1186581885
日/中/韓のためのPython
http://cjkpython.berlios.de/index-ja.html

702 :名無しさん@停滞中 ★ :08/05/24 20:43:23 ID:???
>>699のdat化用正規表現をやろうと思ったんだけど
なにこの怒濤のようなテーブルタグ・・・

こんがらがり過ぎて手もつけられないです
誰か助けてー

703 :名無しさん@停滞中 ★ :08/05/25 11:56:12 ID:???
業務連絡
隠し板になるかどうかわかんないけど
こんな板が出来たようで

VIP避難所
http://yutori.2ch.net/news4vip/




■ VIP避難所できました。
http://yutori.2ch.net/test/read.cgi/news4vip/1211443449/

で調べてみてみたら
みみずんさんの所は既にクロールされておられるようで
さすがだ
2ch-i.netも対応されておられるです
すごい
ゴージャス


それはそうと
板名も同じだしサーバも以前のyutoriを使っているとなると
どうすればいいのかな・・・

704 :名無しさん@停滞中 ★ :08/05/25 12:09:14 ID:???
いちおうJaneで隠し板フォルダに板追加出来たですが
通常のyutoriサーバのnews4vip板の過去スレをサルベージする時には
これどうなるんでしょうか


あとp2todatとかも大変になっちゃうのかなとか

外部コマンド Part5
http://jane.s28.xrea.com/test/read.cgi/bbs/1180559017/515
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
515 名前:Jane使いの名無しさん[sage] 投稿日:2007/09/21(金) 20:31:22 ID:yiiQv+xZ0
>>513
それでした
というかこちらが板名でしか調べてなかったので

http://ex14.vip2ch.com/news4vipニュー速VIP避難所
http://wwwww.2ch.net/news4vipニュー速VIP
これらを同じモノとして認識していたのが原因でした

とりあえず面倒なので暫定処理だけ
http://members.jcom.home.ne.jp/nemu-i-yo/p2todat.zip
これでVIPもちゃんとした場所に保存されます
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


ただ現状のp2todatって
レガシーOSだと何か追加インストールしなければならないみたいなので
自分は使えないんですが。

705 :昼休み@名無しさん@停滞中 ★ :08/05/28 12:44:45 ID:???
やりかけメモ

http://modoki.mine.nu/log/read.php/gline/1165245437/

正規表現
m#<dl><dt><a.+?>([0-9]+)</a>: 名前:(?:<a href="mailto:(.+?)">)?<b>(.+?)</b></a> \[.*?\] 投稿日:(.+?)<dd>(.+?)<br><br></dl>#mik

前処理
s#(ID:)<a href="read.php/.+?>(.+?)</a> (?:\(\d+\))?(<dd.*?>)#$1$2<dd>#igk



ちょっと集中出来ないのでやりかけメモ
デバッグは余裕が出来た時に


それにしても、onmouseoverが消してないもんで
htmltodatのプレビュー部分にマウスを動かすとエラーダイアログが頻繁に出るんですが
何とかなりませんかね?

706 :名無しさん@停滞中 ★ :08/05/29 21:17:53 ID:???
http://society6.2ch.net/test/read.cgi/gline/1165245437/592

ちょっと面倒だったのでずっとやってなかったですが
html化されたURLでの入力変換にもいちおう対応させたつもり

あと「その18a」を追加
そこ知らなかったです

707 :名無しさん@停滞中 ★ :08/05/31 12:18:39 ID:???
メモ
もどきもどき(http://modoki.mine.nu/)のdat化について

URL例
http://modoki.mine.nu/log/read.php/gline/1165245437/1-9999

正規表現
m#<dl><dt><a.+?>([0-9]+)</a>: 名前:.*?(?:<a href="mailto:(.+?)">)?<b>(.+?)</b>.+? \[.*?\] 投稿日:(.+?)<dd>(.+?)<br><br></dl>#mik

前処理
s#<a href="read.php/.+?>(.+?)</a>(?: \(\d+\))?#$1#igk
s#(ID:)( BE:\d+.+?\(\d+\))(.+?)(<dd>)#$1$3$2$4#igk
s#<a target.+?>-キャッシュ-</a>##igk
s#<a target.+?>(.+?)</a>#$1#igk
s#<i>.+?\n##igk
s#</i></dd>###igk
s#<dd class.+?>##igk
s#<img.+?>##ig

708 :名無しさん@停滞中 ★ :08/06/01 10:56:24 ID:???
上の前処理中で

s#</i></dd>###igk



s#</i></dd>##igk

の間違いでした。
大勢に影響ありそうな気がしますがとりあえず変換出来てるのかな。

まあ「変換出来ないぞこら」という反応はあっても
うまく変換出来た場合は無反応な場合が多いかなと
勿論「変換出来ましたかっこいい素敵キャー!」みたいな反応があってもいいけど



あと思ったのは
<a href 〜>hoge</a>の形式のタグはhtmltodat側で削除してくれますが
<a target 〜>hoge</a>のほうは自分でやらないといけないみたいですね。
これが可能なら上の前処理も2行減らせるんですが。

709 :名無しさん@停滞中 ★ :08/06/01 11:02:52 ID:???
DinoSwiftさん復活おめでとうございますありがとうございます
あまり無理なさらずに


ところで最近
http://www.nicovideo.jp/watch/sm2242781
を見たんですが
もしかしてサイトのタイトルは
リリィ・シュシュの「Glide」の一節から取っておられるのかなとか

710 : ◆/vmukiyuzw :08/06/01 21:00:08 ID:N7t4xUrt
>>708
> s#</i></dd>###igk
変換できるかどうか以前に「セパレータの数がマッチしてません」エラーになるかと思ったのですが
特にエラーにはならないし処理も正常に行われるようですね。
ここはbregexp.dllに丸投げの処理なんで、アルゴリズムを推測するしかないのですが
sコマンドで3つめの#(セパレータ)を見つけた時点でセパレータ終了とみなし
以降はオプションとして解析してるんじゃないですかね。
で「#」なんてオプションは存在しないので無視されてるという状況ではないかと。

> <a href 〜>hoge</a>の形式のタグはhtmltodat側で削除してくれますが
> <a target 〜>hoge</a>のほうは自分でやらないといけないみたいですね。
単純に<a 〜> は全部削除するようにしちゃえばいいのかなあ・・・
今<a href 〜>しか削除してないのは単にそれ以外のものを見かけたことがない
だけの理由なんで。

711 :名無しさん@停滞中 ★ :08/06/02 19:43:56 ID:???
>>710
> 変換できるかどうか以前に「セパレータの数がマッチしてません」エラーになるかと思ったのですが

自分もそう思ってたので「おっ」と思ったです


> 単純に<a 〜> は全部削除するようにしちゃえばいいのかなあ・・・
> 今<a href 〜>しか削除してないのは単にそれ以外のものを見かけたことがない
> だけの理由なんで。

>>497でも出していますが
最近のsnapshot(てかrep2)のhtmlでは
<a target〜>形式のもの混じりになってるみたいです。
対処して頂ければ嬉しいです。

まあこの場合は今のままでも前処理で対処出来るのですが
現状では対処できない
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/498-499
を思い出して頂けると小躍りしますです。
MegaBBSや苺BBS等のdat化の際にも使えますので。

・・・自分に出来ない事を要望するのは後ろめたいもんです。

712 :名無しさん@停滞中 ★ :08/06/03 07:29:48 ID:???
メモ

PHPでutf-8へのURLエンコードをする方法について WikipediaやGoogleで使われているURLエンコードはutf-8のようです $keyword ="緑茶"; と変数に入っているとします。 これ.. - 人力検索はてな
http://q.hatena.ne.jp/1196772104
PHP基礎:文字のエンコードを変更する|webnote
http://a-cot.jp/webnote/2007/05/php_2.html
phpのmb_convert_encodingでutf-8からgb2312に変換したいと考えています。 utf-8で書かれたページのフォームから入力し、gb2312で書かれたページに文字を表示したいのです.. - 人力検索はてな
http://q.hatena.ne.jp/1172565776
大猩猩的後花園:PHP中GB2312轉UTF-8的三種方法 - livedoor Blog(ブログ)
http://blog.livedoor.jp/chrisliu/archives/50799724.html

猿頁
http://salv.miscnotes.com/

やっつけ
http://dexi.sytes.net/log/
百度_日本文化?_日本的2CH相当于中国的什??
http://tieba.baidu.com/f?kz=385040063

713 :名無しさん@停滞中 ★ :08/06/03 19:19:40 ID:???
さて
>>699のhtmlをdat化する正規表現を考えたんですが
前処理がうまく合致しないです

元html
http://tieba.baidu.com/f?kz=190540976
のままだと文字化けが激しいので
とりあえずShift_Jisで保存し直してアップ

http://mirror.sarashi.com/htmltodat/190540976.html

htmltodatで呼び出したら
3行目からbodyタグ直前の404行目あたりまで削除して
下記を実行


正規表現
m#<td.+?>([0-9]+)</td>.+?<cc>(.+?)</cc>.+?作者: (?:<a href="(.+?)".+?>)? ?(.+?)(?:</a>)? .+?<font class="gray12">(.+?)</font>#mik

変換結果式
$4<>$3<>$5<>$2<>


これでいちおうdat化出来るです

714 :名無しさん@停滞中 ★ :08/06/03 19:29:14 ID:???
正規表現は&nbspが変換表示されてしまっとるです

m#<td.+?>([0-9]+)</td>.+?<cc>(.+?)</cc>.+?作者: (?:<a href="(.+?)".+?>)? ?(.+?)(?:</a>)?&nbsp.+?<font class="gray12">(.+?)</font>#mik

↑これなんですが
最初「〜&nbsp;〜」とやったらレス3がマッチしなくて
「〜&nbsp〜」とコロン「;」を消したらマッチしたです
何でだろう
不思議だ





問題は前処理ですが

s#\n(?:<meta|<link|</?style|div|a|\.|</?script).+?\n#\n#ig
s#\n\..+?\n#\n#ig
s#\n .+?\n#\n#ig
s#\n +formname.+?\n#\n#ig
w C:\My Documents\テスト.html

これだけやってC:\My Documentsに生成された「テスト.html」を開いてみても
3行目から404行目までのガラガラが全然消えてない。
いったいどこが悪いのだろう
何でだろう
不思議だ

715 :名無しさん@停滞中 ★ :08/06/03 20:15:10 ID:???
念のため書いておくと
これ文字化けは承知の上でやっており
正規表現その他が何とか確定したら
htmltodat.phpでdat化させてJaneNidaで読み込んでみようかなと。

スレッド一覧からsubject.txtを生成するスクリプトも何とかなりそうですが
その生成したsubject.txtを該当フォルダに放り込む為には
板一覧で外部コマンドが実行出来るようになれば良いのですが
残念ながらkoreawatcher ◆Nida.eneRAさんのほうでは実装予定は無いそうで。

http://pc11.2ch.net/test/read.cgi/software/1201790889/254



そういえばtatsuさんのdat2html最新版をDLさせて頂いたのですが
内部処理をUTF-8にされたみたいで。
Delphiでは難しいのかな

http://pc11.2ch.net/test/read.cgi/win/1202424797/840

716 : ◆/vmukiyuzw :08/06/04 19:04:14 ID:mjeajOrF
>>714
例えば

s#\n\..+?\n#\n#ig

ですが、

.p14{font-size:14px;}
.gray{color:#0033cc;}


のような繰り返しを削除したいのだと思いますが、意図に反して
1行目は削除できるけど2行目はできないと思います。
2つめの\nにマッチした時点で正規表現の検索のポインタは次の文字へと
進んでしまうので、2行目にマッチさせようとしてせっかく変換した\nは
読み飛ばされてしまうのです。

これに対処するには「先読み」の機能(?=文字列)を使うといいと思います。
マッチはするけどポインタは進めない、ような感じで処理されます。

s#\n\..+?(?=\n)##ig

だと意図した結果が得られると思います。

# 実をいうと先読み機能はオリジナルのbregexp.dllでは
# サポートされてないのではないかと思っていたのです。ドキュメントにも書いてませんし。
# でもやってみたらたまたまできちゃった、てな次第です

717 :名無しさん@停滞中 ★ :08/06/04 22:29:15 ID:???
>>716

おお!
すっげー!
変換できたです!
ありがとうございます!

先読み使えるのですか。
先読み記号で指定した部分はマッチするだけで置換する際に削除も何ももされないんですか(って自分で書いてても意味不明ですが)
しかし正規表現は奥が深いです
ミノフスキー粒子が濃すぎて先が見えません





中国繋がりでいうと
今日は天安門事件19周年だそうですが
何かニュースで触れられてるのかな。

てか19年前なのか…

718 :名無しさん@停滞中 ★ :08/06/05 08:20:06 ID:???
PHPリファレンス−PHP基本構文 > 基本その他 > $_SERVER["QUERY_STRING"]
http://www.yaskey.cside.tv/php/referdb/index.php?mode=detail&KEY=95
$_SERVER["QUERY_STRING"]の仕様について - 教えて!goo
http://oshiete1.goo.ne.jp/qa1060139.html

719 :名無しさん@停滞中 ★ :08/06/05 12:09:54 ID:???
http://com-nika.osask.jp/test/read.cgi/bbs/1166882974/194
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
[194] nika@管理人★◆nika/si95E : 2008/06/04(水) 19:33:57 ID:TJP3rFKX0
重要なお知らせ

現在このサイトは自宅サーバーで運営されていますが、
今後も継続的に自宅サーバーで運営することが困難になるため、
外部掲示板の保管機能は2008年6月中に終了することになりました。

継続的に利用されている方には申し訳ありませんが、
終了後には基本的にdat落ちしたスレッドは見られなくなりますので
ご了承頂けますよう、お願いいたします。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−



お疲れ様でした。

720 :名無しさん@停滞中 ★ :08/06/05 19:51:21 ID:???
まあ色々ありますが
そうそう落ち込んでいる余裕もなく

万が一
http://tmp6.2ch.net/test/read.cgi/download/1164164363/269
のように「お前のせいだ」とか言う人が居ても
ただただ困惑するのみで

721 :名無しさん@停滞中 ★ :08/06/05 20:05:58 ID:???
という事で
ガラガラを取り除いたhtmlを出力出来たかなと

元URL
http://tieba.baidu.com/f?kz=386794671

ガラガラ除去(ソースを御覧あれ)
http://mirror.s206.xrea.com/x/cn/string.php?http://tieba.baidu.com/f?kz=386794671


で、次の問題は
>>714の正規表現にある2バイト文字で。

具体的に書くと

m#<td.+?>([0-9]+)</td>.+?<cc>(.+?)</cc>.+?作者: (?:<a href="(.+?)".+?>)? ?(.+?)(?:</a>)?&nbsp.+?<font class="gray12">(.+?)</font>#mik

上の「作者:」という箇所で詰まっているみたい。
文字コードgb2312なのでShift_Jisでの「作者:」とは全く違うのでそりゃマッチしないでしょうねと。

簡体字コード一覧表
http://ash.jp/code/cn/gb2312tbl.htm
を見て照合してみると

作 D7F0
者 D5D0
: A3B0

みたいなので
htmltodat.php中の正規表現中の「作者:」部分を

〜\xD7\xF0\xD5\xD0\xA3\xB0〜

と変えてもマッチしない。

しょうがないので「作者:」直線のタグ「<td align=left>」を使ってhtmltodat風に書くと

m#<td.+?>([0-9]+)</td>.+?<cc>(.+?)</cc>.+?<td align=left >.+? (?:<a href="(.+?)".+?>)? ?(.+?)(?:</a>)?&nbsp.+?<font class="gray12">(.+?)</font>#mi

としてやってみたけどマッチしない。
難しいものだ




ちなみにこのスレッドですが
下のエントリーを見て興味が湧いたという訳で。

中国のヲタたちの囁き〜声優編〜 - 大陸浪人のススメ 〜迷宮旅社別館〜
http://blog.goo.ne.jp/dongyingwenren/e/cd06d43c4755f8a377cbf98a39a1721d

722 :名無しさん@停滞中 ★ :08/06/05 21:41:51 ID:???
やりかけ

http://mirror.s206.xrea.com/x/cn/htmltodatbaidu.php?http://tieba.baidu.com/f?kz=386794671

22レスあるスレッドなのに20行しかないのは何故なのだ

$1の連続関係を調べるとレス20と21が抜けてるみたいなのだが
今日はここまで
私の頭脳CPUの限界を越えてるようです



ソースを出しときますので
識者の方 見ておられたら原因を究明して頂きたく。
スクリプトの文字コードがShift_Jisだったりコメントを変えてなかったりと
突っ込みどころ満載ですが。

http://mirror.s206.xrea.com/x/cn/htmltodatbaidu.phps

723 :名無しさん@停滞中 ★ :08/06/06 19:16:30 ID:???
ああ余裕ない

>>722の件ですが
今見てみたら該当レス二つ
透明あぼーんされてるだけでした
ハハハ
どうしよう
あと
レス2の画像URLも本文に入れるように
前処理考えるだなー

いちおうJaneNidaで外部板を設けて
文字コードgb2312で設定して
datを該当フォルダに放り込んで読み込んだら
文字化けせずに読めたです
ばんざーいい


それと

http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/544

小躍りしてます
ありがとうございました

ああそれにしても余裕ない

724 :あぼーん :あぼーん
あぼーん

725 :あぼーん :あぼーん
あぼーん

726 :名無しさん@停滞中 ★ :08/06/07 07:53:21 ID:???
おはようございます
朝からずっこけました
大いに笑かせて頂きました
今日は楽しい一日になりそうです


実際のところ自分はというと
あちこち見てるばかりであまり書き込んだりしませんなー。
というか 見てるだけで精いっぱいお腹いっぱい僕乾杯

727 :名無しさん@停滞中 ★ :08/06/07 18:16:58 ID:???
>>725のほうは消さなくても良かったかも。
なんの事やらまぢわかんないとなってるかもだけど
大した事ないです

というか、JaneNidaだと
ツール→設定→書き込みで
「誤爆警告」「コテハン警告」「Beログイン警告」
のチェック欄があるのですが
他の派生Janeではどうなのでしょう。
ありそうなものですが。


ところでJaneNidaなのですが
スレッド一覧で外部コマンドを使用可能にして下さって
大いに活用させて頂いているです
すごいです

左ペインの板一覧でも外部コマンド使えるようになったら
更に選択肢が拡がるのですが。

728 :名無しさん@停滞中 ★ :08/06/07 18:24:50 ID:???
ところで
nikaさんの所をwebarchiveで検索してみたら
9938ページ保存されてるみたいです

Internet Archive Wayback Machine
http://web.archive.org/web/*sr_1nr_9938/http://com-nika.osask.jp/*

k1とボクシング板が多い・・

htmlばかりでなく
http://web.archive.org/web/20070322190441/com-nika.osask.jp/bbs/bbs.php?http://ex9.2ch.net/test/read.cgi/k1/1099631963/
datもあるのですか
http://web.archive.org/web/20070322133640/com-nika.osask.jp/wom/dat/1130303803.dat


このhtmlも
dat化用正規表現を考えといたほうがいいのかな

729 :名無しさん@停滞中 ★ :08/06/08 19:50:54 ID:???
htmltodat.phpでも透明あぼーんを補うようなコードを追記してみたです

http://mirror.s206.xrea.com/x/cn/htmltodatbaidu.php?http://tieba.baidu.com/f?kz=386794671


次は添付画像のURLを本文に含めるようにしたいなと。

具体的に書くと

http://tieba.baidu.com/f?kz=386794671

のレス2・15・17にある画像URLを本文に含めるように出来ればいちおう完成ですが
これがなかなかマッチしない。
Shift_Jis化してアップし直したものが下記で
正規表現その他は>>713-714で出来るです

http://mirror.sarashi.com/htmltodat/386794671.html

ただ本文は<cc>〜</cc>中にあるんですが画像URLはその中にはなく
直後に

<cc>〜</cc>
</td></tr></table>
</td></tr>
<tr><td height="17"></td><td class="p14">?子相??片: <br><img src=
"http://hiphotos.baidu.com/%CF%E0%C0%C7%D7%DA%BD%E9/pic/item/05592bf09cab92d07931aaa3.jpg"
border="0" onerror="checkErrorImage(this)"></td></tr>
<tr><td height="17"></td>
<td align=left >作者: 121.32.233.* 

となっておるです
これを</cc>直前にする為に
前処理で

s#(</cc>).+?(?:<img src="(.+?)".+?>)?.+?(<td align=left >)#$2<br>$1 $3#ig

とかやっても全然マッチせず。
改行コードをまたいだりしてるのとかも問題なのかな。

730 :名無しさん@停滞中 ★ :08/06/09 20:15:50 ID:???
御冥福をお祈りします


関連で

百度_日本文化_秋叶原で通り魔 白昼の惨劇【組図・転載】
http://tieba.baidu.com/f?kz=403408591

をdat化して読み込みたいんですが
やはり添付画像を本文に含めるやり方がうまくいかぬ

http://mirror.s206.xrea.com/x/cn/htmltodatbaidu.php?http://tieba.baidu.com/f?kz=403408591


御冥福をお祈りします

731 :名無しさん@停滞中 ★ :08/06/10 20:30:08 ID:???
メモ

「日中文化交流」と書いてオタ活動と読む:ニコニコ動画のパクリと言われる「AcFun.cn 天下漫友是一家」について - livedoor Blog(ブログ)
http://blog.livedoor.jp/kashikou/archives/51145664.html#comments
阿?海姆株式会社
http://hi.baidu.com/tentamashi
大陸浪人のススメ 〜迷宮旅社別館〜
http://blog.goo.ne.jp/dongyingwenren
繁体字→簡体字変換
http://www.tulips.tsukuba.ac.jp/misc/export/cat/hankan/
AOL Q&A広場 中国語簡体字 ←→ 中国語繁体字 変換
http://aol.okwave.jp/qa2976707.html
漢字変換道具 [JavaScript版]
http://homepage3.nifty.com/jgrammar/ja/tools/tradkan0.htm
Wikipedia:?繁一多??校?表 - Wikipedia
http://zh.wikipedia.org/wiki/Wikipedia:%E7%AE%80%E7%B9%81%E4%B8%80%E5%A4%9A%E5%AF%B9%E5%BA%94%E6%A0%A1%E9%AA%8C%E8%A1%A8
hao123网址之家--在?繁体字??
http://www.hao123.com/haoserver/jianfanzh.htm


文字化け何とかならないものか。
0ch掲示板のUTF-8化スクリプトのほうを使えばそりゃ化けなくなるけど
専用ブラウザで文字化けする人ばかりだろうし
って 専用ブラウザでここ見てる人 どれくらい居るのかな

732 :名無しさん@停滞中 ★ :08/06/10 20:57:52 ID:???
中国語と日本語の対応表 -OKWave
http://okwave.jp/qa1732315.html?ans_count_asc=20
とある研究者の余録: 繁体字変換は便利だけど
http://voyage-log.seesaa.net/article/62271244.html#more
Chinese Core Simplified Chars
http://xahlee.org/lojban/simplified_chars.html
インクジェットプリンターのKGK紀州技研工業|豆知識_文字コードの話/簡体字の世界
http://www.kishugiken.co.jp/cn/code10.html
インクジェットプリンターのKGK紀州技研工業|豆知識_文字コードの話/簡体字対照リスト(あいうえお順)
http://www.kishugiken.co.jp/cn/code10c.html
中文−広東語対応表(基本編) - Thank you for the music
http://blog.goo.ne.jp/ico3/e/23780e9b4cb8286bbf7b2a230f70e765

733 :名無しさん@停滞中 ★ :08/06/11 21:35:45 ID:???
【かちゅ】2chブラウザ「Katju88」Part10【クローン】
http://pc11.2ch.net/test/read.cgi/software/1140337471/l50

170さんすげー!
しかもレス175でこんな事↓書いてるのにすげー!

> 自分はC++歴はそれなりにあるんだけど、Delphiはまったく知らないし。
> いきなり挫折・・・



有形無形問わず、実際に物を作っている人って
すごい謙虚で研究熱心で探求心豊かで
新しい時代の流れに呑み込まれず
確かな目つきと落ち着いた判断を備えていて
さもない質問にも真摯に対応される紳士なのだなーと。

さらにいろいろ書こうかなと思ったら
そうかこれこそまさしく
「実るほど頭を垂れる稲穂かな」
だなーと。
その態度見習わなきゃです

734 :名無しさん@停滞中 ★ :08/06/12 21:33:56 ID:???
>>729の件
やっとマッチしたです

URL例
http://mirror.sarashi.com/htmltodat/386794671.html

正規表現
m#<td.+?>([0-9]+)</td>.+?<cc>(.+?)</cc>.+?作者: (?:<a href="(.+?)".+?>)? ?(.+?)(?:</a>)? .+?<font class="gray12">(.+?)</font>#mik

前処理
s#\r##ig
s#\n##ig
s#(</cc>)</td></tr></table></td></tr><tr><td height="17"></td><td class="p14">[^<]+?<br><im
g src="(.+?)".+?></td></tr><tr><td height="17"></td>#<br><br>$2$1#ig

変換結果式
$4<>$3<>$5<>$2<>



ポイント(つか悩みどころ)は二つ。


(1) 複数行にまたがる箇所を置換する為には
  いったん改行コードを全削除する必要があるみたい


(2) 前処理の3番目は最初

  〜<td class="p14">.+?<br>〜

  としたら何故か最大マッチ(?)してしまっていたので
  やむなく

 〜<td class="p14">[^<]+?<br>〜

 としたら上手くいったみたい



突っ込み所多数あるでしょうけど
これで百度掲示板の添付画像URLを本文に含められそうです

735 : ◆/vmukiyuzw :08/06/13 01:40:02 ID:u/UqlNCi
正規表現の.(ドット)は「改行を除く」一文字にマッチということらしいので
無理やりかもしれませんが(?:.|\n)とか使うと多少シンプルにできるかも・・・
試してないのでわかりませんけど。(\rもいるかも)

736 :名無しさん@停滞中 ★ :08/06/13 20:37:32 ID:???
という事でやってみたです

http://mirror.s206.xrea.com/x/cn/htmltodatbaidu.php?http://tieba.baidu.com/f?kz=386794671


JaneNidaの該当フォルダにこのdatを入れて読み込んでみると
画像ビューアや外部コマンド翻訳もうまくいってるみたい

http://mirror.sarashi.com/img/janebaidu.png

という事で
次は一覧のsubject.txt化ですか


>>735
> 正規表現の.(ドット)は「改行を除く」一文字にマッチということらしいので

そうだったのかー!!
ところで、htmltodatでメニューhtmlからsubject.txtを作成するオプションとか
あったらいいなーという要望とか思ったんですがどうでしょうか。

737 : ◆/vmukiyuzw :08/06/13 21:33:02 ID:cARXftE6
>>736
> ところで、htmltodatでメニューhtmlからsubject.txtを作成するオプションとか
> あったらいいなーという要望とか思ったんですがどうでしょうか。

メニューhtmlてのが何のことを言ってるのかよくわからないですが
subback.htmlからsubject.txtを作るのは前処理で容易にできる気がします

738 :名無しさん@停滞中 ★ :08/06/14 12:44:26 ID:???
>>737
えーと、言葉が足りませんでしたが

> subback.htmlからsubject.txtを作るのは前処理で容易にできる気がします

いちおう出来るには出来ますが
ヘッダとフッタが残ってしまい
それらを手動で消さなければならないように思うですが。
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038409548/72
のように。


頭の体操的に無理矢理に考えてみると

ヘッダ除去
s#^(?.|\n|\r)+?(\n.+?<>)#$1#ik
フッタ除去
s#(<>(?:\r)?\n)(?:.|\n|\r)+?$#$1#igk

とかなるのかな。。
先読みの使い方ってこれでいいのかな。




具体的には

http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy

とか

http://tieba.baidu.com/f?kw=%C8%D5%B1%BE%CE%C4%BB%AF

からsubject.txtを生成したいのですが
試行錯誤するツールがあったら嬉しいなと思ったのです

739 :名無しさん@停滞中 ★ :08/06/14 13:33:49 ID:???
特殊文字は
タブ(\t)とかもあるですか。
他にもあるかな。
あと使ってないのに先読み云々とか
なに口走ってるんだろ

ところで>>716で教えて頂いた先読みですが
htmltodat正規表現の$6に該当する部分を
まるまるこれと差し替えられそうですね。
具体的に書くと、例えば

m#<dt.*?>([0-9]+).+?(?:"mailto:(.+?)">)?<b>(.+?)</b>(?:</font>|</a>) ?:(.*?)<dd> ?(.*?)<br><br>(<dt.*?>|</dl>)#mi

これを

m#<dt.*?>([0-9]+).+?(?:"mailto:(.+?)">)?<b>(.+?)</b>(?:</font>|</a>) ?:(.*?)<dd> ?(.*?)<br><br>(?=<dt.*?>|</dl>)#mi

とやっても良さそうです。(Bregexp.dllでは非推奨でしょうけど)



「何の意味が?」とか言われそうですけど
新たにhtmltodatのようなスクリプトを組む時にかなり楽になりそうだなと。
JavaScriptやwsh・phpでやってみた時
正規表現でマッチした$6を残す処理が少し(というか結構)面倒だったので。

740 :名無しさん@停滞中 ★ :08/06/14 18:53:18 ID:???
ところで 秋葉原の件以降
やたらにxreaのサーバ負荷率が上がってるです
特に週半ば以降が顕著で。

−−−−−−−−−−−−−−−−−
20080614
▽アカウントの負荷率
  3) 313 pt - mirror.s151.xrea.com
20080613
▽アカウントの負荷率
  2) 519 pt - mirror.s151.xrea.com
20080612
▽アカウントの負荷率
  8) 154 pt - mirror.s151.xrea.com
20080611
▽アカウントの負荷率
  7) 73 pt - mirror.s151.xrea.com
20080610
▽アカウントの負荷率
  4) 329 pt - mirror.s151.xrea.com
20080609
▽アカウントの負荷率
  0 pt
20080608
▽アカウントの負荷率
  0 pt
20080607
▽アカウントの負荷率
  0 pt
20080606
▽アカウントの負荷率
  0 pt
20080605
▽アカウントの負荷率
  0 pt
20080604
▽アカウントの負荷率
  0 pt
−−−−−−−−−−−−−−−−


負荷率とかよくわかんないんですが
13・14とすごい。
14日って今日なのでもっと数字増えるかもです


調べてみるとこれが原因かな。
追記でimona.phpへのリンクがあって
そこからどわーっと来てるみたい


【秋葉原連続殺傷事件外伝】 まりえったの歌日記♪さん さきほど閉鎖:Birth of Blues
http://birthofblues.livedoor.biz/archives/50661072.html


xreaのアカウントが消されなければ自分的にはどうでもいいんですが
そうなってからでは後の祭りなので
何かやっといたほうが良いのかもしれないのかなと。

一時的にimona.phpを待避させてみますか

741 : ◆/vmukiyuzw :08/06/14 20:08:44 ID:RgmD5VXT
>>738
もちろんヘッダやフッタも前処理で取り除く前提で考えてたんですが

> http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy
> http://tieba.baidu.com/f?kw=%C8%D5%B1%BE%CE%C4%BB%AF

前者はともかく後者はヘッダが長すぎて一発のsコマンドでは
fatal errorを起こしてしまうので何回かに分けて地道にやるしか
なさそうですね。

しかし、このアプローチで出来ないんであれば、すでに私の力及ばずというか
> ところで、htmltodatでメニューhtmlからsubject.txtを作成するオプションとか
> あったらいいなーという要望とか思ったんですがどうでしょうか。
単なるhtmltodatのオプション追加でできるレベルとは思えないのです。
例にあげていただいた2つでも形式がまったく違いますし。

それこそ個別のスクリプト書くか、汎用的にしたいならhtmltosubみたいな
別ツール作ったほうがいいのではと思う次第です。
私はやる気が湧かないので、いっそご自分で作ってみてはいかが?

742 :名無しさん@停滞中 ★ :08/06/14 21:56:07 ID:???
> >‎ http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy
> >‎ http://tieba.baidu.com/f?kw=%C8%D5%B1%BE%CE%C4%BB%AF
>
> 前者はともかく後者はヘッダが長すぎて一発のsコマンドでは
> fatal errorを起こしてしまうので何回かに分けて地道にやるしか
> なさそうですね。

うーむ


とりあえずUTF-8にしてアップしてみたです

http://mirror.sarashi.com/htmltodat/subjecttest.html

前処理で

s#\n(?:<meta|<link|</?style|div|a|\.|</?script|<input|[^<]).+?(?=\n)##ig
s#\r(?=\n)##ig
s#\n(?=\n)##ig

これでガラガラと空行がある程度省けたので
かなり見通しがよくなったかな

で、肝心のデータ部分は

<td class="d">80037</td>
<td class="d">354</td>
<td class="s"><a class=t href="/f?kz=22542052" target=_blank > 初到?京的感
受~~(ZT) </a>[<font class="red">精品</font>]&nbsp;[<font class="red">置?</fon
t>]&nbsp;</td>

なので以下略
後で考えてみますか

743 : ◆/vmukiyuzw :08/06/15 02:14:11 ID:TDdn/yNm
前処理とかはなんとかなりそうですね
あと問題になりそうなのはスレ番号をどうやって決めるか
これはスレ保存をどうやってやるかによるのでなんとも言えないです

744 :名無しさん@停滞中 ★ :08/06/15 20:06:15 ID:???
疲れちゃったので一回休み

やってて思ったのですが
前処理がうまくいったかどうかwコマンドで保存して
保存したものをエディタで開いて
駄目なのでエディタを閉じて保存したファイルを消して
またやり直して保存したものをエディタで開いて確認して
・・という作業がなかなか煩雑に思えたので
wコマンドはそれとして
簡易的に下窓に前処理変換結果が出たら楽かもなーと夢想したです
おやすみなさい

745 : ◆/vmukiyuzw :08/06/15 21:12:50 ID:TDdn/yNm
>>744
まあおっしゃることはわかりますし自分でもあったらいいかなと思うことはあるのですが
簡易的表示ではあまり意味をなさないというかやっぱ改行マークとかは表示したいなあと
そしたらそれなりに面倒な改造になる上あまり使い勝手がいいものに仕上げる自信もないので
wコマンドで逃げてるってのが正直なところで。

ところで

> 保存したものをエディタで開いて
> 駄目なのでエディタを閉じて保存したファイルを消して

自分が主に使ってるエディタは秀丸ですがこんな手間はかからないです。
ファイルを開いた状態でも他から上書きは可能ですし、「再読み込み」という機能を使うと
最新の状態で読み直してくれるのでワンアクションで済みさほど煩雑には感じないのです。
エディタにもいろいろあるしどれをお使いかわからないですけどそれほど特殊な機能とも思えないので
可能かどうか調べてみては。

746 : ◆/vmukiyuzw :08/06/15 23:40:11 ID:TDdn/yNm
補足ですが

> ファイルを開いた状態でも他から上書きは可能ですし、
これは排他制御関連の設定で、大抵のエディタにはついてるのではと思います。

> 「再読み込み」という機能を使うと
これはアンドゥ系の機能で、名前は違えどやはり実装されてるものが多いと思います。
ちなみにxyzzyでは「最初からやり直し」という機能名でありました。

# おっともうすぐ500KBですね。余計な書き込みはこれまでにて

747 :名無しさん@停滞中 ★ :08/06/17 20:03:20 ID:???
リアルよりバーチャルが大事、と思いたい
戦わなくちゃ非現実と
二次元こそリアルワールドという友人がうらやましい
でも余裕が無い


>>745-746

> 簡易的表示ではあまり意味をなさないというかやっぱ改行マークとかは表示したいなあと

いやーそんなに考えなくてもいいような。
改行マークとかなくても意味あると思うです

エディタですが、TeraPadを主に使ってるですが
「TeraPad 排他制御」で検索して

TeraPad_help
http://web.archive.org/web/20070807212724/http://www.harpy.org/delfy/tpadhelp/tips51.html

読んでみて設定を色々試してみて
何とか反映する事が出来たです
すごいです

ただ、このTeraPadってUTF-8対応されてますが
簡体字・繁体字・ハングル等が文字化けするのが何だかななのですが
秀丸ではそれらも問題ないのでしょうか。
あと色々な文字コードのファイルを読み書き保存出来るのかな
シェアウェアみたいなので怖くて(?)試せないです
xyzzyにまたチャレンジしてみますか


それとやっていて思ったのですが
前処理でwコマンド込みの式を入れて
「dat変換をしない」にチェックして変換ボタンを押すと
データを呼び出したりコピペしたりしていなくても
サイズ0のファイルが生成されるみたい。
まあ大した事ではないです


ところで下のエントリーを読んで

内モンゴルと草原の誘い【前篇】 - 大陸浪人のススメ 〜迷宮旅社別館〜
http://blog.goo.ne.jp/dongyingwenren/e/645fe944a3e53c92e97f337e46d33c94

紹介されてる元スレッドの画像がいたく美しく
dat化して読んでみたく思ったです
外部コマンドで文章翻訳とか出来るので。

百度_呼????_原?-美?的呼???
http://tieba.baidu.com/f?kz=312028377

で、これ現在173レスあるみたいなんですが
50区切りで表示されているもんでどうしようか。。
全部表示するやり方とかあるのかな


えーと
ここって500KBだったか512KBだったか。
どちらにしてもまた1000まで到達出来ないのか

501 KB [ 2ちゃんねるが使っている 完全帯域保証 レンタルサーバー ]

新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail (省略可) :