携帯で見る
2ch DAT落ちスレ ミラー変換スクリプトについて考える掲示板
トップ画像はこちらからいただきました

読めないdat落ちスレのhtmlミラー作ります避難所のほうで出た変換スクリプトについて考えてみる掲示板です。

【注意】
(1) この掲示板でdat落ちスレのhtml化等は受け付けていません
とりあえずhttp://www.geocities.jp/mirrorhenkan/で探してみて下さい。
(2) スパム対策としてアドレスはエイチ抜きで書いて下さいです(ごめんなさい)

 
2005.5/1

あなたも掲示板を作りませんか?→ 無料レンタル掲示板YYかきこFAQ
わいわい仲間
他のわいわいカキコ仲間掲示板へのリンクです

2ちゃんねる完全互換無料レンタル掲示板:YYかきこ
「あなたも簡単にスレッド式掲示板のオーナーに!」


1: メモ4 (304) 2: ご意見ご質問ご要望をどうぞ (871) 3: 雑談2 (731) 4: 検索しても、クリックするとエラーに… (34) 5: メモ3 (747) 6: テスト書き込み (38) 7: DAT落ちしたスレッドをHTML化します (494) 8: 読めないdat落ちスレのhtmlミラー作ります [87] (238) 9: メモ2 (845) 10: 雑談 (795) 11: 裏メモ (47) 12: メモ (793) 13: dat落ちスレのミラー作ります@ymag (308) 14: スレタイ: 2ch VIP系ブログ アフェリエイト問題 (71) 15: JavaScript演習【1時限目】 (177) 16: 読めないdat落ちスレのhtmlミラー作ります避難所 (1001) 17: 【スマ板】dat落ちのミラー作ります【限定】1 (230) 18: 職人急募! 〜 DAT落ちスレミラーリング融通所 (103) 19: 読めないdat落ちスレの2chブラウザdatアップキボンヌ[8] (843) 20: JavaScript Tips コレクション (72) 21: JavaScript使ってるサイトは糞 (43) 22: 手とり足とり教えるJavaScriptスレ (47) 23:   1行javascriptプログラミング    (280) 24: Javascriptで「戻る」を作るのやめてくれない? (30) 25: + JavaScript の質問用スレッド vol.36 + (119) 26: dat落ちして読めないスレのミラー作ります。in カップル板 (37) 27: ライブスレッド検索について気づいたこと (14) 28: ★みみずん板出席簿(い)★ (42) 29: \(^▽^)/ みみずんさん ありがとう (44) 30: JavaScript:document.body.innerHTMLのガイドライン3 (25) 31: 読めないdat落ちスレのhtmlミラー作ります [87] (1001) 

誰でも簡単に使える専用レンタルサーバー
100Mbps完全帯域保障 Banana 877 ( 初回五台限定 )
NEW !!  使い放題でーす。QRコード、DDNSサービス。 http://news.47.kg/
        Maido3.com オリジナルキャラクターを作っちゃいました。>> Maido3.com オリジナル壁紙
快適2ちゃんねるライフ、>> 2ちゃんねる ビューア

【1:304】メモ4
1 名前:名無しさん@停滞中 ★ :08/06/17 20:07:26 ID:???
はてさて思いついた事など

295 名前:名無しさん@停滞中 ★ :09/06/15 19:27:31 ID:???
> ミラーURLや正規表現その他を柔軟に個別指定出来るようになっていたら
> どんなにか素晴らしい事でしょうか。

と書いてから同梱のLogServers.iniを開いてみたら
どうやら自分でミラー先とか増やしたり出来るじゃないですか。
クッキー送信の項目も用意してありますし。
変換結果式や後処理が無いのが残念ですが。
でもすごい


この機能がJaneNidaに付加されたら嬉しいのですが
どうかな。
要望するのは図々しいかな

296 名前:名無しさん@停滞中 ★ :09/06/15 19:43:20 ID:???
あと別にいいですけど
LogServers.ini内のsnapshot用正規表現のうち

step7=s#(<><>)(.*?)( :)#<>$2<>#ig

↑これ不要です

どれもこれもやっつけで作った正規表現だもんで
まだあるかもしれないけど
まあいいや

297 名前:名無しさん@停滞中 ★ :09/06/15 19:52:36 ID:???
改めてhttp://yy14.kakiko.com/test/read.cgi/mirror/1186175383/497を見てみると
直したほうが良さそうな件が2点


s#\n(?:\t| +).+?\n##ig
s#\n<div.+?\n##ig



s#\n(?:\t| +).+?(?=\n)##ig
s#\n<div.+?(?=\n)##ig


この2行 ガラガラ削除の為の正規表現なんですが
肯定先読みにしないと1行づつ残っちゃうです。

まあ現状 dat化出来てるので別にいいんですが。

298 名前:名無しさん@停滞中 ★ :09/06/21 01:50:36 ID:???
やっとfaviconの表示方法判った
URLがサブドメインじゃない場合こうするのね
ちぃ覚えた でもちょびっツよくわかんない

299 名前:名無しさん@停滞中 ★ :09/06/26 20:32:12 ID:???
新型トリップについてなんですが
http://qb5.2ch.net/test/read.cgi/operate/1244993904/309
をコピペして見てみると

---------------------------------------------------
if (length $handle_pass >= 12)
{
my $mark = substr($handle_pass, 0, 1);
if ($mark eq '#' || $mark eq '$')
{
if ($handle_pass =~ m|^#([[:xdigit:]]{16})([./0-9A-Za-z]{0,2})$|)
{
$GB->{TRIPSTRING} = substr(crypt(pack('H*', $1), "$2.."), -10);
}
else
{
# 将来の拡張用
$GB->{TRIPSTRING} = '???';
}
}
else
{
use Digest::SHA1 qw(sha1_base64);
$GB->{TRIPSTRING} = substr(sha1_base64($handle_pass), 0, 12);
$GB->{TRIPSTRING} =~ tr/+/./;
}
}
else
{
# 従来形式
(省略されました・・全てを読むにはここを押してください)


300 名前:名無しさん@停滞中 ★ :09/06/27 08:12:03 ID:???
2chtrip - プロジェクト・ナニ屋 Wiki
http://sourceforge.jp/projects/naniya/wiki/2chtrip

鳥屋さんだとしたら
下のサイトでものすごくお世話になりました
そうかcryptってそういうものだったのかと

http://user64.psychedance.com/2004/11/spec_2ch_trip.html
http://user64.psychedance.com/2004/11/sample_des_cryp.html

301 名前:名無しさん@停滞中 ★ :09/07/01 21:23:13 ID:???
webarchives folksonomy / ウェブアーカイブス・フォークソノミー
http://atashi.com/webarchives/

302 名前:名無しさん@停滞中 ★ :09/07/02 20:07:31 ID:???
http://pc12.2ch.net/test/read.cgi/software/1244340535/654,716

「ミラー貝入の人」って私のことなのかな

で「貝入」って何ぞやとググってみるかと
検索フォームに「ミラー貝入」と入れた途端に
「ミラー貝入 ◆nobita.o2w」が選択候補に出たです

http://www.google.co.jp/search?hl=ja&q=%E3%83%9F%E3%83%A9%E3%83%BC%E8%B2%9D%E5%85%A5+%E2%97%86nobita.o2w&lr=&aq=0&oq=%E3%83%9F%E3%83%A9%E3%83%BC%E8%B2%9D%E5%85%A5

TBS実況板の住人の方みたいですね。
別人です

303 名前:名無しさん@停滞中 ★ :09/07/02 20:11:30 ID:???
それはそうと
今回ググってみて
更にミラーサイトを出されておられる方が。

番組表 and 2ちゃんねる
http://ftvjapan.ddo.jp/~funa/tv/
-------------------------------------------------------------
cnt=266

番組表と2ちゃんねるのカキコ連携保存。
あの番組の時にどういうライブ書き込みがあったか、過去に戻って確認するツール。
βバージョン (2009/03/30)
-------------------------------------------------------------


実況板のミラーを出しておられるみたい
あとで追加させて頂こうかなと


http://ftvjapan.ddo.jp/~funa/tv/2ch/2009/0506/TBS/1241589167.html
http://ftvjapan.ddo.jp/~funa/tv/2ch/2009/0506/TBS/
http://ftvjapan.ddo.jp/~funa/tv/2ch/2009/0506/NTV/
http://ftvjapan.ddo.jp/~funa/tv/2ch/2009/0702/NHK/


作者さんのブログ

ふなブログ
http://ftvjapan.ddo.jp/

304 名前:名無しさん@勉強中 :09/07/03 07:54:05 ID:qI2HGxmd
>>302
「ミラー貝入」とは藤子不二夫の漫画「ドラえもん」の
主人公、野比のび太が鏡面世界に入ったときに使う
変名である。

「かがみの国へごあんないしよう ミラー貝入」

なお本人は大真面目で「ミラー怪人」のつもりで書いていた。

名前: E-mail: レンタルサーバーよいサーバー

【2:871】ご意見ご質問ご要望をどうぞ
1 名前:みみずん :02/02/26 01:42 [ Q5FljW5A ]

(・∀・)ノ ご意見ご質問ご要望をどうぞ♪
< )
 ハ

862 名前:850 :09/03/18 20:01:10 ID:aRU2a53y
セキュリティについてご相談があるのですが、
どこか静かに話せる場所はありますか?

863 名前:名無しさん@勉強中 ★ :09/03/19 02:38:18 ID:???
>>862
えーと・・・

ココやhttp://jbbs.livedoor.jp/computer/38622/で差し支えがあるようでしたら
メールでも頂けたら。
或いはmixiに入っていらっしゃるのでしたら
mirrorhenkan等の検索ワードで見つかると思うので
そちらから連絡を頂くとかどうでしょうか。

864 名前:850 :09/03/19 12:38:02 ID:TJQpO0i/
いつも利用させていただいてます。
セキュリティについて重大な報告がありますので、
クローズな環境で話をさせていただこうと思います。

作者さんのメールアドレスを探してみたのですが、見つけることができなかったので
教えていただく事は可能でしょうか
そちらへ私のほうからレポートのメールを送りたいと思います。


865 名前:850 :09/03/19 15:03:13 ID:TJQpO0i/
mixi のほうに連絡させていただきました。

866 名前:名無しさん@勉強中 ★ :09/03/19 16:31:11 ID:???
>>864-865
返信させて頂きました。(って空メールですが)

867 名前:名無しさん@勉強中 ★ :09/03/21 03:57:54 ID:???
受け取ったです。
うーむ・・・すごい。勉強になるです。
ありがとうございました。

で、確かにこれ 大っぴらに書くのは憚られるような内容ですね。
こういう事って はまちちゃんみたいに公に話題にするのも難しいので<自分
ここ見てる方々ごめんなさい

とりあえず教えて頂いた再現手順を試してみてから
色々と考えてみようかなと思います

868 名前:850 :09/03/23 15:01:27 ID:PPdteW8X
再現させるのが結構手間がかかったりして、
お手数おかけしますがよろしくお願いします。

869 名前:名無しさん@勉強中 ★ :09/03/28 21:47:01 ID:???
時間を盗みつつやっているんですが
この一週間というもの なかなか時間を盗めずに
あれやこれやで泊りがけの状態であります
今週は三回帰宅出来たのかな
という訳で
再現すら全部はまだままならない状態なのです

で、朦朧としながらままならぬ状況でやりながら
0chサポート板の不具合関係のスレッド見てみたら
御指摘頂いた不具合のうちの少なくとも2点は
0ch作者さん 直しておられるみたい。

自分がUTF-8化させて頂いたスクリプトは
http://0ch.mine.nu/public/scripts/
のtest060227なんですが
今回の御指摘で見てみると
test070124では結構セキュリティ周りの修正が多いのかなとか思ったです。
で、それらXSS/XSRFの脆弱性(カッケー!)というものは模倣されるのも困りものなので
詳細な説明を避けて「不具合修正」というだけに留めたのかも。

だったらtest070124のほうをUTF-8化すれば良かったのにと言われそうですが(って誰に)
http://mirror.s151.xrea.com/0ch_utf8/の更新日を見ると
2006.3/26に出した奴だったので出来なかったなと。

という訳で、余裕が出来たら再現を確認してから
070124を基に最初からやり直してみようかなと。
ついでに管理画面も英語化したりしてみようか。
出来るかな

あと、ドメイン逆引き出来なかったりcom/org/net等のIPは
(省略されました・・全てを読むにはここを押してください)


870 名前:850 :09/04/02 16:12:07 ID:7Rd8dD1e
おつとめご苦労様です。

私のところで使っている物は臨時に対応を終えましたので、
管理人さんの納得のいく形でゆっくり対応していただけたらと思います。

おっしゃられるとおり、再現性には手間がかかるものなので慌てるものではないという部分に同意です。

871 名前:名無しさん@勉強中 ★ :09/04/04 11:04:58 ID:???
はいです
ゆっくり落ち着いてからやってみようかと思うです

名前: E-mail:
いい鯖ありますよBIGなレンタルサーバ

【3:731】雑談2
1 名前:名無しさん@勉強中 ★ :07/02/21 21:18:26 ID:???
これまた適当に

722 名前:名無しさん@停滞中 ★ :09/06/07 13:09:55 ID:???
地デジカのライバル、アナログマが人気 応援歌も登場(産経新聞)
http://headlines.yahoo.co.jp/hl?a=20090606-00000535-san-ent
http://s04.megalodon.jp/2009-0607-0044-08/headlines.yahoo.co.jp/hl?a=20090606-00000535-san-ent

これhttp://12fnhsmmk.jugem.jp/?eid=801のブログから飛んだ記事なんですが

> “なおざ/り”と“お/ざなり”の言葉の使い分けもできないのかこの評論家…

わかんなかったので調べてみたです
JaneNidaのWebPoupuは便利だ

【なおざり】

1 いいかげんにしておくさま。本気でないさま。おろそか。「―な練習態度」「子供のしつけを―にする」

2 ほどほどで、あっさりしているさま。

・「よき人は、ひとへに好けるさまにも見えず、興ずるさまも―なり」〈徒然・一三七〉
[用法] なおざり・ないがしろ――「学業をなおざり(ないがしろ)にする」のように、いいかげんにする意では相通じて
用いられる。◇「なおざり」は、きちんとすべきことを手を抜いていいかげんにするさまをいう。「なおざりに聞き流す」
「なおざりにできない問題」◇「ないがしろ」は大切にすべきものを粗略に扱う、また無視するさまをいう。「親をない
がしろにする」のように用いる。◇類似の語「ゆるがせ」は「なおざり」と同じく、手を抜いておろそかにするさま。「一
刻もゆるがせにできない」のように用いる。

【おざなり】

[名・形動]いいかげんに物事をすませること。その場だけの間に合わせ。また、そのさま。「―を言う」「―な処置をする」


で、記事での使い方はというと
(省略されました・・全てを読むにはここを押してください)


723 名前:名無しさん@停滞中 ★ :09/06/07 13:19:26 ID:???
うむむ?

Yahoo!知恵袋の引用文をもう一度読むと

-----------------------------------------------
「〜をなおざりにする」を「〜をお座なりにする」とは言いません。
「お座なりの対応だ」を「なおざりの対応だ」とは言いません。
-----------------------------------------------

で、記事の引用文

----------------------
民意をなおざりにしている
----------------------

「民意をなおざりにしている」を言い換えると
「民意をなおざりにする」ですね。
さらに、さっきのYahoo!国語辞典の文

--------------------------------------------------------
「なおざり」は、きちんとすべきことを手を抜いていいかげんにするさまをいう。
---------------------------------------------------------


これって知恵袋の説明と完全に対立するです。
どちらが正しいのかな



で、やはり「民意をなおざりにしている」
(省略されました・・全てを読むにはここを押してください)


724 名前:名無しさん@停滞中 ★ :09/06/08 12:51:22 ID:???
#おもしろネタ速報のまとめ
http://www.mixallow.net/omo/

725 名前:名無しさん@停滞中 ★ :09/06/09 19:57:46 ID:???
kkryuのもーそーすぺーす
http://www.voiceblog.jp/kkryu/


連日更新されてて驚いたです

726 名前:名無しさん@停滞中 ★ :09/06/12 07:56:49 ID:???
生理のお悩みスレリンク集@2ch
http://carnation.s57.xrea.com/pms/pms_2ch.html

楽::技林ブログ
http://tech.bayashi.jp/

727 名前:名無しさん@停滞中 ★ :09/06/12 20:57:00 ID:???
「どうせ無駄なものだ」と手を抜いて作れば
それば無駄なものでしかないけど
「無駄ではない!」と本気で作れば、
どんな物でも役に立つ。
少なくても作った人たちの血肉にはなる。

728 名前:名無しさん@停滞中 ★ :09/06/13 19:43:02 ID:???
ニュース速報++ 北朝鮮 国連脱退か
http://news2plus.blog123.fc2.com/blog-entry-566.html

729 名前:名無しさん@停滞中 ★ :09/06/19 08:29:02 ID:???
GIMP思い込みチュートリアル(GIMPの使い方)
http://gimp.blog.shinobi.jp/

730 名前:名無しさん@停滞中 ★ :09/06/20 08:39:28 ID:???
http://birthofblues.livedoor.biz/archives/50822005.html

何だか怖いんですけど

731 名前:名無しさん@停滞中 ★ :09/06/24 17:53:06 ID:???
皆殺しの天使
http://elangel.exblog.jp/11808904/
Unbalance World.com
http://anbalanz.blog33.fc2.com/page-13.html

名前: E-mail:
まるごとbananaあります。レンタルサーバ

【4:34】検索しても、クリックするとエラーに…
1 名前:検索さん :02/06/08 00:10 [ K3n2gpuU ]

なって表示が出来ないのですが…。どうしたら良いのでしょうか?

25 名前:みみずん :05/01/25 22:15:18 [ 5gZMTyIQ ]
>>24
machi.toに変更しました。
machibbs.comはレジストラへの料金支払い忘れからmachi.toと併用になっていたと思うのですがmachibbs.comは無効になったのでしょうか。
うちではハンゲームのページにはつながらず問題なく使えましたので。。。
全板確認するのも面倒なので全板machi.toに置換したので問題ありましたらお教え下さい。

26 名前:検索さん :05/01/26 11:00:48 [ cudhA7Kg ]
おはようございます
今の時刻はhttp://www.machibbs.com/まちBBSの画面が出ます。
私も経験がありますが、関東の住民さんも深夜帯にハンイタ(ゲーム)に飛ぶって仰っていました。
ありがとうございました。

27 名前:名無しさん@勉強中 :06/11/06 00:47:59 ID:nEGzFMkK
2ちゃんスレのみみずんミラーを見ようとするといっつも(1分半前後で)タイムアウト
になってしまい(↓のメッセージが出る)最後まで見れません。当方ISDN回線ですが、
何とかなりませんかね?

「CGI Timeout

the specified CGI apprication exceeded the allowed
time for processing. The server has deleted the
process」

28 名前:名無しさん@勉強中 ★ :06/11/06 07:42:46 ID:???
>>27
君は運がいいぞ。
同じ質問をしていたヤツがいたからそっちで答えが出てきたら教えてもらうとよい。
http://jbbs.livedoor.jp/bbs/read.cgi/computer/682/1023462648/30n-

29 名前:名無しさん@勉強中 :07/01/05 08:37:27 ID:cpvkFLR8
とんきんまーとって何なん?

30 名前:名無しさん@勉強中 ★ :07/01/05 09:53:07 ID:???
わかんないです。

31 名前:zaq3d2e1e5a.zaq.ne.jp :07/01/06 06:50:28 ID:ChdZ3xGp
700番に投稿したのに何で投稿できてないの?

投稿済みの画面が出ましたが????
http://yy14.kakiko.com/test/read.cgi/mirror/1115123243/700

勝手に一部分のみコピペせんとってよ〜!ってことを書いたのですが、
再度書くのも面倒だから書かんけど無関係と書いてる人物と
私のログがコピペされてるそのコピペの投稿者はどちらも★が付いてるから
あなたこのyyカキコ板の管理人さんなの?とか書いたのよ〜!

32 名前:名無しさん@勉強中 ★ :07/01/06 08:48:09 ID:???
えーと
何を書けばいいのやら

>>31さん
http://jbbs.livedoor.jp/bbs/read.cgi/computer/682/1144317464/405
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
405 :403 :sage :2007/01/05(金) 08:29:03 (p)ID:fKnnOw8c(3)
全く関係のないリンクでした。スルーでおねがいします。

http://search.yahoo.co.jp/search?fr=slv1-mdp&p=%ca%d0%ba%b9%c3%cd%a1%a1%a4%df%a4%df%a4%ba%a4%f3
  ↓ここでなさっているようですが、もうここには来ないでyyカキコで続ければ如何ですか?
ttp://yy14.kakiko.com/test/read.cgi/mirror/1115123243/620

見るの疲れるんです。閑古鳥が賑わうのはイイけどここで続けるってスレ違いだと思うし。

◆みみずん氏は完全に貴方の投稿に関しては終了宣言済み!!!◆
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

この投稿は>>31さんのものですか?
別人ならごめんなさいですが。

この文章を普通に読むと
私(いちおう「このyyカキコ板の管理人さん」ですが)と
あちらのスレッドの283さんが同一人物であると誤解されているようです。
えーと・・全くの別人なんですが。
まあ証明する方法もないですしその気もないですが
あちらのスレッドで283さんが否定してくれる事を祈りましょう。
(そういう投稿があっても「ホントにそうなの〜??」と言われそうですが)

(省略されました・・全てを読むにはここを押してください)


33 名前:Alan :08/08/24 07:26:42 ID:tiyam70f
Nice writing. You are on my RSS reader now so I can read more from you down the road.

34 名前:名無しさん@停滞中 ★ :08/08/24 10:40:06 ID:???
to Alan

Thanks.
By the way, what is interested you about my site?

名前: E-mail:
ステップアップに最適レンタルサーバ

【5:747】メモ3
1 名前:名無しさん@勉強中 ★ :07/08/04 06:09:43 ID:???
またまた思いついた事など

738 名前:名無しさん@停滞中 ★ :08/06/14 12:44:26 ID:???
>>737
えーと、言葉が足りませんでしたが

> subback.htmlからsubject.txtを作るのは前処理で容易にできる気がします

いちおう出来るには出来ますが
ヘッダとフッタが残ってしまい
それらを手動で消さなければならないように思うですが。
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038409548/72
のように。


頭の体操的に無理矢理に考えてみると

ヘッダ除去
s#^(?.|\n|\r)+?(\n.+?<>)#$1#ik
フッタ除去
s#(<>(?:\r)?\n)(?:.|\n|\r)+?$#$1#igk

とかなるのかな。。
先読みの使い方ってこれでいいのかな。




具体的には

http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy

とか
(省略されました・・全てを読むにはここを押してください)


739 名前:名無しさん@停滞中 ★ :08/06/14 13:33:49 ID:???
特殊文字は
タブ(\t)とかもあるですか。
他にもあるかな。
あと使ってないのに先読み云々とか
なに口走ってるんだろ

ところで>>716で教えて頂いた先読みですが
htmltodat正規表現の$6に該当する部分を
まるまるこれと差し替えられそうですね。
具体的に書くと、例えば

m#<dt.*?>([0-9]+).+?(?:"mailto:(.+?)">)?<b>(.+?)</b>(?:</font>|</a>) ?:(.*?)<dd> ?(.*?)<br><br>(<dt.*?>|</dl>)#mi

これを

m#<dt.*?>([0-9]+).+?(?:"mailto:(.+?)">)?<b>(.+?)</b>(?:</font>|</a>) ?:(.*?)<dd> ?(.*?)<br><br>(?=<dt.*?>|</dl>)#mi

とやっても良さそうです。(Bregexp.dllでは非推奨でしょうけど)



「何の意味が?」とか言われそうですけど
新たにhtmltodatのようなスクリプトを組む時にかなり楽になりそうだなと。
JavaScriptやwsh・phpでやってみた時
正規表現でマッチした$6を残す処理が少し(というか結構)面倒だったので。

740 名前:名無しさん@停滞中 ★ :08/06/14 18:53:18 ID:???
ところで 秋葉原の件以降
やたらにxreaのサーバ負荷率が上がってるです
特に週半ば以降が顕著で。

−−−−−−−−−−−−−−−−−
20080614
▽アカウントの負荷率
  3) 313 pt - mirror.s151.xrea.com
20080613
▽アカウントの負荷率
  2) 519 pt - mirror.s151.xrea.com
20080612
▽アカウントの負荷率
  8) 154 pt - mirror.s151.xrea.com
20080611
▽アカウントの負荷率
  7) 73 pt - mirror.s151.xrea.com
20080610
▽アカウントの負荷率
  4) 329 pt - mirror.s151.xrea.com
20080609
▽アカウントの負荷率
  0 pt
20080608
▽アカウントの負荷率
  0 pt
20080607
▽アカウントの負荷率
  0 pt
20080606
(省略されました・・全てを読むにはここを押してください)


741 名前: ◆/vmukiyuzw :08/06/14 20:08:44 ID:RgmD5VXT
>>738
もちろんヘッダやフッタも前処理で取り除く前提で考えてたんですが

> http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy
> http://tieba.baidu.com/f?kw=%C8%D5%B1%BE%CE%C4%BB%AF

前者はともかく後者はヘッダが長すぎて一発のsコマンドでは
fatal errorを起こしてしまうので何回かに分けて地道にやるしか
なさそうですね。

しかし、このアプローチで出来ないんであれば、すでに私の力及ばずというか
> ところで、htmltodatでメニューhtmlからsubject.txtを作成するオプションとか
> あったらいいなーという要望とか思ったんですがどうでしょうか。
単なるhtmltodatのオプション追加でできるレベルとは思えないのです。
例にあげていただいた2つでも形式がまったく違いますし。

それこそ個別のスクリプト書くか、汎用的にしたいならhtmltosubみたいな
別ツール作ったほうがいいのではと思う次第です。
私はやる気が湧かないので、いっそご自分で作ってみてはいかが?

742 名前:名無しさん@停滞中 ★ :08/06/14 21:56:07 ID:???
> >‎ http://www.ichigobbs.net/cgi/aska_list.cgi?bo=economy
> >‎ http://tieba.baidu.com/f?kw=%C8%D5%B1%BE%CE%C4%BB%AF
>
> 前者はともかく後者はヘッダが長すぎて一発のsコマンドでは
> fatal errorを起こしてしまうので何回かに分けて地道にやるしか
> なさそうですね。

うーむ


とりあえずUTF-8にしてアップしてみたです

http://mirror.sarashi.com/htmltodat/subjecttest.html

前処理で

s#\n(?:<meta|<link|</?style|div|a|\.|</?script|<input|[^<]).+?(?=\n)##ig
s#\r(?=\n)##ig
s#\n(?=\n)##ig

これでガラガラと空行がある程度省けたので
かなり見通しがよくなったかな

で、肝心のデータ部分は

<td class="d">80037</td>
<td class="d">354</td>
<td class="s"><a class=t href="/f?kz=22542052" target=_blank > 初到?京的感
受~~(ZT) </a>[<font class="red">精品</font>]&nbsp;[<font class="red">置?</fon
t>]&nbsp;</td>
(省略されました・・全てを読むにはここを押してください)


743 名前: ◆/vmukiyuzw :08/06/15 02:14:11 ID:TDdn/yNm
前処理とかはなんとかなりそうですね
あと問題になりそうなのはスレ番号をどうやって決めるか
これはスレ保存をどうやってやるかによるのでなんとも言えないです

744 名前:名無しさん@停滞中 ★ :08/06/15 20:06:15 ID:???
疲れちゃったので一回休み

やってて思ったのですが
前処理がうまくいったかどうかwコマンドで保存して
保存したものをエディタで開いて
駄目なのでエディタを閉じて保存したファイルを消して
またやり直して保存したものをエディタで開いて確認して
・・という作業がなかなか煩雑に思えたので
wコマンドはそれとして
簡易的に下窓に前処理変換結果が出たら楽かもなーと夢想したです
おやすみなさい

745 名前: ◆/vmukiyuzw :08/06/15 21:12:50 ID:TDdn/yNm
>>744
まあおっしゃることはわかりますし自分でもあったらいいかなと思うことはあるのですが
簡易的表示ではあまり意味をなさないというかやっぱ改行マークとかは表示したいなあと
そしたらそれなりに面倒な改造になる上あまり使い勝手がいいものに仕上げる自信もないので
wコマンドで逃げてるってのが正直なところで。

ところで

> 保存したものをエディタで開いて
> 駄目なのでエディタを閉じて保存したファイルを消して

自分が主に使ってるエディタは秀丸ですがこんな手間はかからないです。
ファイルを開いた状態でも他から上書きは可能ですし、「再読み込み」という機能を使うと
最新の状態で読み直してくれるのでワンアクションで済みさほど煩雑には感じないのです。
エディタにもいろいろあるしどれをお使いかわからないですけどそれほど特殊な機能とも思えないので
可能かどうか調べてみては。

746 名前: ◆/vmukiyuzw :08/06/15 23:40:11 ID:TDdn/yNm
補足ですが

> ファイルを開いた状態でも他から上書きは可能ですし、
これは排他制御関連の設定で、大抵のエディタにはついてるのではと思います。

> 「再読み込み」という機能を使うと
これはアンドゥ系の機能で、名前は違えどやはり実装されてるものが多いと思います。
ちなみにxyzzyでは「最初からやり直し」という機能名でありました。

# おっともうすぐ500KBですね。余計な書き込みはこれまでにて

747 名前:名無しさん@停滞中 ★ :08/06/17 20:03:20 ID:???
リアルよりバーチャルが大事、と思いたい
戦わなくちゃ非現実と
二次元こそリアルワールドという友人がうらやましい
でも余裕が無い


>>745-746

> 簡易的表示ではあまり意味をなさないというかやっぱ改行マークとかは表示したいなあと

いやーそんなに考えなくてもいいような。
改行マークとかなくても意味あると思うです

エディタですが、TeraPadを主に使ってるですが
「TeraPad 排他制御」で検索して

TeraPad_help
http://web.archive.org/web/20070807212724/http://www.harpy.org/delfy/tpadhelp/tips51.html

読んでみて設定を色々試してみて
何とか反映する事が出来たです
すごいです

ただ、このTeraPadってUTF-8対応されてますが
簡体字・繁体字・ハングル等が文字化けするのが何だかななのですが
秀丸ではそれらも問題ないのでしょうか。
あと色々な文字コードのファイルを読み書き保存出来るのかな
シェアウェアみたいなので怖くて(?)試せないです
xyzzyにまたチャレンジしてみますか
(省略されました・・全てを読むにはここを押してください)


名前: E-mail:
完全帯域保証レンタルサーバ

【6:38】テスト書き込み
1 名前:663 :05/04/28 23:12:02 ID:8fZwrlv/
テスト書き込みです。

659さん、ごめんなさい。
一ヶ月間書き込みが無いと消えてしまうそうなので、許して下さい。
多分、したらば(http://jbbs.livedoor.jp/computer/21256/
)のほうが長持ちするでしょうから、許して下さい。


29 名前:DinoSwift :07/09/10 22:40:48 ID:h2UjzZT+
(へ´ A`) かけない


30 名前:DinoSwift :07/09/10 22:42:12 ID:h2UjzZT+
(へ´ A`) すみません、なぜかメモ3のスレにかけなかったのでこちらのスレに書かせてもらいます。


(へ´ω`) ありがとです。
      現時点での動かし方で書き込み頻度の低いカテゴリ100板で
      4時間程度かかってます。

      で、なにをいまさら的な話なんですがgzipで圧縮されたデータではなく
      生のdatを直接落としてました。
      これを早めにgzipを落とすように改造します。
      (ただDLするのに早くなる分、解凍で同じように時間かかるような気がしなくもないですが
       2ちゃん側に負荷が減る分そっちのほうがよさげですね。)
      
      >>104はレス数をメモったファイルを作ってDLしようとするたびに
      チェックをするために検索をしなくちゃいけなくなるか、ローカルに保存してある
      datを開いてレス数の比較をしなくちゃいけなくなるっぽいので無理かもしれないです。

      たびたび質問で申し訳ないんですが
      利用者数の多い板、dat落ちしやすい板がわかるようなサイトとかってあるんでしょうか?
      巡回頻度を板ごとに詳細に分けるのが一番効果的は方法かもしれない。
      
      23ch.infoさんとこの保管庫が各板一度にDLを開始したなら保管スレ数でそれもわからんこともないですが・・・。

31 名前:名無しさん@勉強中 ★ :07/09/12 07:54:01 ID:???
いやー、自分もよくわからんです。
運用情報板のほうで色々出ていると思うのですが
例えば
http://rock.s54.xrea.com/
のサーバ負荷監視関係のリンクを見てみるくらいしか無さそうな。
あと659さんがお書きになられた所とか。

http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1164941934/393

あと、どれくらいでdat落ちするかとかいうのは
同じ所にあるSETTING.TXTの説明の表くらいしかないのかもです。

書き込みの多い板だと1001到達も速いので
それだけdat落ちも速いのだろうなと思うのですが
あとは勘に頼るしかないのかな。


それと、gzip取得おめでとうございます。
ただproxomitron経由で見ると
wannabeのサイトはまだgzip送信に対応しておられないのか
「Content-Encoding: gzip」というログが無かったです


それにしても、過去の自分の書き込みを見ると
懐かしいと同時に すんごく恥ずかしいですね
穴があったら入りたく思ったです。

32 名前:DinoSwift :07/09/13 00:17:52 ID:7QnObL11
(へ*´ω`) 今朝、gzipでの取得に成功したんですが
      そのプログラムで取得したスレが結構の割合で壊れてました。
      ちょっと原因調査中です。

      うちのサイトもせっかくなのでgzipによる圧縮転送を行うようにしました。
      正直、送信のほうは気にするほど転送量はないんですが・・・。
      見栄を張ってみた。

33 名前:名無しさん@勉強中 :07/09/13 20:52:01 ID:hkQLqY71
急に思い出したのですが
そういえば AASの偽物を作ってる時
perlのgzip受信ってどえらくめんどくさいみたいだなーと
結局出来なかった記憶があるです。

http://aas.k2.xrea.com/

phpやwshだとgzipとか意識せずに問題なく取得出来るんですが
perlだとどうやっても出来なかったです。
だもんでやりかけのまんまだったのか と
今頃思い出したりして。



という事で
当方でも対応してみました

http://www.geocities.jp/mirrorhenkan/wannabe/?u=http://ex20.2ch.net/test/read.cgi/gline/1165245437/

「?u=」の後に探したいスレッドのURLを入れれば
対応するURLが出てくると思うです。
「その33」という事で。



ただ心配なのは
xmlhttpを使っているので
未対応のブラウザがあるのかなという事で。

上のURL 見えてますか?>ALL

34 名前:名無しさん@勉強中 :07/11/08 16:29:42 ID:kvAimt++
テスト
ttp://yahoo.co.jp

35 名前:名無しさん@勉強中 :08/02/27 01:02:43 ID:q7sSLrsR
test

36 名前:名無しさん@勉強中 :08/04/12 17:29:34 ID:4spp4fiv
てすと

37 名前:名無しさん@勉強中 :08/09/10 20:01:19 ID:Ri/oF+mI
てst

38 名前:名無しさん@勉強中 :09/05/17 04:57:27 ID:TqYU/sdX
てす

名前: E-mail:
思うがままレンタルサーバ

【7:494】DAT落ちしたスレッドをHTML化します
1 名前:名無しさん@まいぺ〜す :03/12/04 20:24 ID:zr6kf+Yb
アトピー板の落ちたスレッドのHTML化や、どこか逝ってしまった過去ログ探します。

________________________________________
(\_/)  (最強サーバの登場!転送量無制限・完全帯域保障)
( ´∀`)。oO (Bananaサーバは→ http://maido3.com/ から)

485 名前:qngobechtk :08/02/04 21:06:52 ID:f5qusrNd
[link=http://cbohtag.jolerrman.net/ ]cbohtag.jolerrman.net[/link]
[link=http://pysy.jolerrman.net/ ]pysy.jolerrman.net[/link]
[link=http://hajo.jolerrman.net/ ]hajo.jolerrman.net[/link]
[link=http://lcqkbpb.jolerrman.net/ ]lcqkbpb.jolerrman.net[/link]
[link=http://uhmb.jolerrman.net/ ]uhmb.jolerrman.net[/link]
[link=http://ldxlpdu.jolerrman.net/ ]ldxlpdu.jolerrman.net[/link]
[link=http://oaew.prosshar.net/ ]oaew.prosshar.net[/link]
[link=http://sqtt.prosshar.net/ ]sqtt.prosshar.net[/link]
[link=http://eomp.prosshar.net/ ]eomp.prosshar.net[/link]
[link=http://dxnk.prosshar.net/ ]dxnk.prosshar.net[/link]
[link=http://oykzm.prosshar.net/ ]oykzm.prosshar.net[/link]
[link=http://thze.prosshar.net/ ]thze.prosshar.net[/link]
[link=http://nkh.prosshar.net/ ]nkh.prosshar.net[/link]
[link=http://mzmqevx.prosshar.net/ ]mzmqevx.prosshar.net[/link]
[link=http://gbcxs.prosshar.net/ ]gbcxs.prosshar.net[/link]
[link=http://yifxd.prosshar.net/ ]yifxd.prosshar.net[/link]
[link=http://jafz.prosshar.net/ ]jafz.prosshar.net[/link]
[link=http://hqzfmc.prosshar.net/ ]hqzfmc.prosshar.net[/link]
[link=http://qhp.prosshar.net/ ]qhp.prosshar.net[/link]
[link=http://waekzxk.prosshar.net/ ]waekzxk.prosshar.net[/link]
[link=http://brou.prosshar.net/ ]brou.prosshar.net[/link]
[link=http://tzbdl.prosshar.net/ ]tzbdl.prosshar.net[/link]
[link=http://pub.prosshar.net/ ]pub.prosshar.net[/link]
[link=http://unjmug.prosshar.net/ ]unjmug.prosshar.net[/link]
[link=http://bex.prosshar.net/ ]bex.prosshar.net[/link]
[link=http://nyivxm.prosshar.net/ ]nyivxm.prosshar.net[/link]
[link=http://nnhmnca.prosshar.net/ ]nnhmnca.prosshar.net[/link]
[link=http://hingqhk.prosshar.net/ ]hingqhk.prosshar.net[/link]
[link=http://wlls.prosshar.net/ ]wlls.prosshar.net[/link]
[link=http://ognppv.prosshar.net/ ]ognppv.prosshar.net[/link]
(省略されました・・全てを読むにはここを押してください)


486 名前:kctilrszud :08/02/04 21:39:42 ID:DEua3SSI
[link=http://qkiykua.prosshar.net/ ]qkiykua.prosshar.net[/link]
[link=http://kgwy.prosshar.net/ ]kgwy.prosshar.net[/link]
[link=http://hiuyi.prosshar.net/ ]hiuyi.prosshar.net[/link]
[link=http://tnhtctd.prosshar.net/ ]tnhtctd.prosshar.net[/link]
[link=http://qdk.prosshar.net/ ]qdk.prosshar.net[/link]
[link=http://qpj.prosshar.net/ ]qpj.prosshar.net[/link]
[link=http://tcgzl.prosshar.net/ ]tcgzl.prosshar.net[/link]
[link=http://curckyl.prosshar.net/ ]curckyl.prosshar.net[/link]
[link=http://ungabs.prosshar.net/ ]ungabs.prosshar.net[/link]
[link=http://dcaaxv.prosshar.net/ ]dcaaxv.prosshar.net[/link]
[link=http://hkyuv.prosshar.net/ ]hkyuv.prosshar.net[/link]
[link=http://klavwpn.prosshar.net/ ]klavwpn.prosshar.net[/link]
[link=http://aiu.prosshar.net/ ]aiu.prosshar.net[/link]
[link=http://cjec.prosshar.net/ ]cjec.prosshar.net[/link]
[link=http://tsuubge.prosshar.net/ ]tsuubge.prosshar.net[/link]
[link=http://jihlvx.prosshar.net/ ]jihlvx.prosshar.net[/link]
[link=http://bxqie.prosshar.net/ ]bxqie.prosshar.net[/link]
[link=http://havdp.hripolee.net/ ]havdp.hripolee.net[/link]
[link=http://pynhkp.hripolee.net/ ]pynhkp.hripolee.net[/link]
[link=http://eveynie.hripolee.net/ ]eveynie.hripolee.net[/link]
[link=http://zszaug.hripolee.net/ ]zszaug.hripolee.net[/link]
[link=http://tamt.hripolee.net/ ]tamt.hripolee.net[/link]
[link=http://eznftjb.hripolee.net/ ]eznftjb.hripolee.net[/link]
[link=http://truskgo.hripolee.net/ ]truskgo.hripolee.net[/link]
[link=http://zqcnbhu.hripolee.net/ ]zqcnbhu.hripolee.net[/link]
[link=http://ziwtwr.hripolee.net/ ]ziwtwr.hripolee.net[/link]
[link=http://rrcz.hripolee.net/ ]rrcz.hripolee.net[/link]
[link=http://sop.hripolee.net/ ]sop.hripolee.net[/link]
[link=http://qpnovtj.hripolee.net/ ]qpnovtj.hripolee.net[/link]
[link=http://ujc.hripolee.net/ ]ujc.hripolee.net[/link]
(省略されました・・全てを読むにはここを押してください)


487 名前:ovfbpxerhu :08/02/04 22:07:08 ID:DEua3SSI
[link=http://ivuvk.hripolee.net/ ]ivuvk.hripolee.net[/link]
[link=http://cmnv.hripolee.net/ ]cmnv.hripolee.net[/link]
[link=http://rxdv.hripolee.net/ ]rxdv.hripolee.net[/link]
[link=http://negh.hripolee.net/ ]negh.hripolee.net[/link]
[link=http://rvnrz.hripolee.net/ ]rvnrz.hripolee.net[/link]
[link=http://ewgiaov.hripolee.net/ ]ewgiaov.hripolee.net[/link]
[link=http://kyx.hripolee.net/ ]kyx.hripolee.net[/link]
[link=http://krmug.hripolee.net/ ]krmug.hripolee.net[/link]
[link=http://jeyqcx.hripolee.net/ ]jeyqcx.hripolee.net[/link]
[link=http://vctx.hripolee.net/ ]vctx.hripolee.net[/link]
[link=http://rlrbw.hripolee.net/ ]rlrbw.hripolee.net[/link]
[link=http://mweraov.hripolee.net/ ]mweraov.hripolee.net[/link]
[link=http://jvhsqx.hripolee.net/ ]jvhsqx.hripolee.net[/link]
[link=http://sunqcfb.hripolee.net/ ]sunqcfb.hripolee.net[/link]
[link=http://lkpsc.hripolee.net/ ]lkpsc.hripolee.net[/link]
[link=http://oskp.hripolee.net/ ]oskp.hripolee.net[/link]
[link=http://tmgl.hripolee.net/ ]tmgl.hripolee.net[/link]
[link=http://bhhp.hripolee.net/ ]bhhp.hripolee.net[/link]
[link=http://xkzett.hripolee.net/ ]xkzett.hripolee.net[/link]
[link=http://lgcdm.hripolee.net/ ]lgcdm.hripolee.net[/link]
[link=http://hvmdj.hripolee.net/ ]hvmdj.hripolee.net[/link]
[link=http://uipwfp.hripolee.net/ ]uipwfp.hripolee.net[/link]
[link=http://rjlw.hripolee.net/ ]rjlw.hripolee.net[/link]
[link=http://rawdyqa.hripolee.net/ ]rawdyqa.hripolee.net[/link]
[link=http://wmv.hripolee.net/ ]wmv.hripolee.net[/link]
[link=http://ubsjhwe.hripolee.net/ ]ubsjhwe.hripolee.net[/link]
[link=http://wlcd.hripolee.net/ ]wlcd.hripolee.net[/link]
[link=http://dla.hripolee.net/ ]dla.hripolee.net[/link]
[link=http://szazc.hripolee.net/ ]szazc.hripolee.net[/link]


488 名前:名無しさん@勉強中 ★ :08/02/05 19:34:02 ID:???
あら久しぶり

でもプレゼンテーションも も少し考えたほうが良いのでは。
せめてどういうサイトなのかみたいな説明が欲しいですよー。

とりあえず様子見しましょ

489 名前:nxtzbxotdc :08/02/06 17:32:41 ID:IaJIsLH7
[link=http://xvspuuo.ebook-my-home.com/ ]xvspuuo.ebook-my-home.com[/link]
[link=http://vlrwr.ebook-my-home.com/ ]vlrwr.ebook-my-home.com[/link]
[link=http://mvelg.ebook-my-home.com/ ]mvelg.ebook-my-home.com[/link]
[link=http://ziqcju.ebook-my-home.com/ ]ziqcju.ebook-my-home.com[/link]
[link=http://mxuyj.ebook-my-home.com/ ]mxuyj.ebook-my-home.com[/link]
[link=http://ecurooz.ebook-my-home.com/ ]ecurooz.ebook-my-home.com[/link]
[link=http://oumkf.ebook-my-home.com/ ]oumkf.ebook-my-home.com[/link]
[link=http://etrxc.ebook-my-home.com/ ]etrxc.ebook-my-home.com[/link]
[link=http://vrgdycd.ebook-my-home.com/ ]vrgdycd.ebook-my-home.com[/link]
[link=http://xtq.ebook-my-home.com/ ]xtq.ebook-my-home.com[/link]
[link=http://ckunc.ebook-my-home.com/ ]ckunc.ebook-my-home.com[/link]
[link=http://egoe.ebook-my-home.com/ ]egoe.ebook-my-home.com[/link]
[link=http://amat.ebook-my-home.com/ ]amat.ebook-my-home.com[/link]
[link=http://bmtown.ebook-my-home.com/ ]bmtown.ebook-my-home.com[/link]
[link=http://ktou.ebook-my-home.com/ ]ktou.ebook-my-home.com[/link]
[link=http://oanoj.ebook-my-home.com/ ]oanoj.ebook-my-home.com[/link]
[link=http://vontsj.ebook-my-home.com/ ]vontsj.ebook-my-home.com[/link]
[link=http://ounlg.ebook-my-home.com/ ]ounlg.ebook-my-home.com[/link]
[link=http://hlmv.ebook-my-home.com/ ]hlmv.ebook-my-home.com[/link]
[link=http://plogi.ebook-my-home.com/ ]plogi.ebook-my-home.com[/link]
[link=http://xiruz.ebook-my-home.com/ ]xiruz.ebook-my-home.com[/link]
[link=http://gzs.ebook-my-home.com/ ]gzs.ebook-my-home.com[/link]
[link=http://yzgruy.ebook-my-home.com/ ]yzgruy.ebook-my-home.com[/link]
[link=http://qcd.ebook-my-home.com/ ]qcd.ebook-my-home.com[/link]
[link=http://ohvxp.ebook-my-home.com/ ]ohvxp.ebook-my-home.com[/link]
[link=http://waig.ebook-my-home.com/ ]waig.ebook-my-home.com[/link]
[link=http://yzhfiqt.ebook-my-home.com/ ]yzhfiqt.ebook-my-home.com[/link]
[link=http://xti.ebook-my-home.com/ ]xti.ebook-my-home.com[/link]
[link=http://vlbgnxl.ebook-my-home.com/ ]vlbgnxl.ebook-my-home.com[/link]
[link=http://vtzf.ebook-my-home.com/ ]vtzf.ebook-my-home.com[/link]
(省略されました・・全てを読むにはここを押してください)


490 名前:名無しさん@勉強中 ★ :08/02/06 18:38:31 ID:???
うむむ
エストニアからようこそです
そちらはさぞかし寒いのでしょうね。
だいぶ以前にエストニアの無料メールアカウントと無料サーバを
お借りした事があったっけなあと思いつつ。

それにしてもほんとワールドワイドだなー。
ここもTDLが出たら面白いんですが。
Faceちゃんねるとかだとロシアのスパム投稿が結構あるみたいで
何だか面白いですし。



えーと
とりあえず「リンク」の英語読み(という書き方は本末転倒ですが)
をエヌジーにしてみたです

491 名前:fmqzrijiux :08/02/08 03:02:48 ID:UjEjyddB
http://qiypmj.fuknek.com/
http://quojegs.fuknek.com/
http://dupv.fuknek.com/
http://qwstyyf.fuknek.com/
http://mmlv.fuknek.com/


492 名前:qeqehnvyql :08/02/08 06:32:22 ID:HAK0jJge
http://iacqfsm.fuknek.com/
http://zgtrp.fuknek.com/
http://srsvhuo.fuknek.com/
http://ulm.fuknek.com/
http://yrkno.fuknek.com/
http://mqpf.fuknek.com/


493 名前:名無しさん@勉強中 ★ :08/02/08 07:36:11 ID:???
いやしかしほんとに国際的ですな
中国とイタリアからの書き込みですか。
ちょっとめんどくさくなってきたんで
アドレスを貼れないようにしたです。

まあキャップ付きだと問題無いみたいですし
別にいいかなと。
テスト

http://yahoo.co.jp/


エヌジーに正規表現を使えれば
エイチティーティーピーが例えば5個以上あったら投稿出来ないようにとか出来るですが
(勿論2ch/bbspink等のそれは除外して)
ここでは出来ないっぽいですし。


で、調べてみたら
大陸中国からのアクセスって
台湾韓国香港からのアクセスよりも実は多いみたいで。
数の多さって凄いなーと。
ドメイン逆引き出来ないIPばかりだったもんで
今までよくわかんなかったです


メモ
中国のどの辺りなのか
余裕が出来たら調べてみよう
(省略されました・・全てを読むにはここを押してください)


494 名前:名無しさん@勉強中 ★ :08/02/08 07:46:29 ID:???
それにしても切実に思うんですが

宣伝だけじゃなくて
何か書いてってよう
その国に住んでるかどうかはわかんないですが
少なくとも島国日本の方ではないみたいだしー
どういう人でどんな生活をしてるのかとか興味があるんだよう
まず多分自分は一生行かない国かもしれないですし。


でもあんまり「○○からようこそ」とか書いてると
見てる人が気味悪がるかもとか思ったりしたですが
んもうほんとにアクセス数が半端じゃなくなってるもんで
そんな心配せんでも大丈夫ですと書いてみるですか

名前: E-mail:
まいど3クオリティBIGなBIGなサーバです!

【8:238】読めないdat落ちスレのhtmlミラー作ります [87]
1 名前:水先案名無い人 :2005/05/04(水) 22:37:15 ID:XADRfvps0
前スレ 読めないdat落ちスレのhtmlミラー作ります避難所 (実質[86])
 http://that3.2ch.net/test/read.cgi/gline/1081082635/
 http://p2.chbox.jp/read.php?host=that3.2ch.net&bbs=gline&key=1081082635&ls=l50

★dat落ちかな?と思ったら…… まずは下のページを読んでみてください。
http://ansitu.xrea.jp/guidance/?pastlog

★ルクダルさんは引退しました。長い間ご苦労様でした。
 現在は心の広い●持ちサン達が特別にログ提供してくれている状況です。

★依頼の仕方
1.依頼する前に次の方法を試してみてください。
・まず、避難所スレ653氏の作ったフォーム(http://kintubo.kakiko.com/mirror/)を使ってみてください。
 URLを入力するだけで主要なログ保管サイトにあるhtmlを簡単に探すことができます。
・snapshot 2ch(http://snapshot.publog.net/)にログが残っている場合もあります。
 (確率は低いと思われますが・・・)
2.どうしても見つからなかったときは、見たいスレのURLを書き込んでください。
 html形式でログが見られるように●持ちサンが協力してくれます。
 ただし、●で取得できないスレは提供できません。あきらめてください。

★ログ提供者の機嫌を損ねる言動はご遠慮ください。ログ提供者がいなくなればスレが成り立たなくなります。

★大切な過去ログはソースを自分のパソコンに保存しておきましょう。
 今はネット上に存在しているサイトも明日になれば消滅しているかもしれません。

★かちゅ等のdatファイルを希望の時は、以下のスレへどうぞ。
 読めないdat落ちスレの2chブラウザdatアップキボンヌ[8]
 http://that3.2ch.net/test/read.cgi/gline/1109953945/

★内容は覚えているけどURLがわからないときは、以下のスレに頼んでみましょう。
(省略されました・・全てを読むにはここを押してください)


229 名前:friends :07/11/08 12:27:41 ID:4YgIsCcq
<A HREF=" http://gunezx.com/690/gay-straight-quiz.html "><b>gay straight quiz</b></A><br> <A HREF=" http://gunezx.com/690/guyanese-girls.html "><b>guyanese girls</b></A><br>

230 名前:google :07/11/08 12:30:23 ID:adzEUSvK
<A HREF=" http://gunezx.com/650/preteen-bbs.html "><b>preteen bbs</b></A><br> <A HREF=" http://gunezx.com/650/old-duck-porn-site.html "><b>old duck porn site</b></A><br>

231 名前:google :07/11/08 12:31:48 ID:w1PKmlY9
<A HREF=" http://ssinkel.com/a/cartoon-pussy.html "><b>cartoon pussy</b></A><br> <A HREF=" http://ssinkel.com/a/gay-french-kiss.html "><b>gay french kiss</b></A><br>

232 名前:名無しさん@勉強中 :07/11/08 12:49:21 ID:kvAimt++
>>224-231
うーむ
御丁寧にみんなIDが違うですね。
ブラジルやマレーシアのホスト経由(かどうかわかんないけど)の投稿みたい。
あとIPがドメイン逆引きできないとこのもちらほらと。
whoisとかで調べるのも億劫だもな

さて、どうしましょうか。

NGワードを設定しようにも
普通なら「<A HREF=」とか「<br>」とかを設定すればいいでしょうけど
htmltodatの正規表現等でよく使うのでこれではいかん。
yykakikoのほうで何かそれ以外の設定とかあるのかな。
ちょっとわかんないです。
ホストで規制とかも上の奴はてんでんバラバラなので意味なさそう。
同じ団体がやってるのかどうかもわかんないし

自分で設置したものなら何か出来そうですが
そこまでの自由度はyykakikoには無さそうですし。


粛々と処理するしかないのかな?

233 名前:friends :07/11/08 15:48:29 ID:CBI6rrOR
<A HREF=" http://hyhrwu.com/1/drunk-naked-men.html "><b>drunk naked men</b></A><br> <A HREF=" http://hyhrwu.com/1/students-fucking.html "><b>students fucking</b></A><br>

234 名前:msn search :07/11/08 15:53:23 ID:EFVB/aUn
<A HREF=" http://hyhrwu.com/2/women-in-jail.html "><b>women in jail</b></A><br> <A HREF=" http://hyhrwu.com/2/color-climax-70s-porn.html "><b>color climax 70s porn</b></A><br>

235 名前:名無しさん@勉強中 ★ :07/11/08 16:11:17 ID:???
いやー
意味がわかる書き込みならまだいいんですけど。
んもう困った困った

とりあえずこのスレッドは
キャップ持ちでないと書けないようにしてみたです。

236 名前:名無しさん@勉強中 ★ :07/11/08 16:27:42 ID:???
テスト
http://yahoo.co.jp/

237 名前:名無しさん@勉強中 ★ :07/11/08 16:47:20 ID:???
> NGワードを設定しようにも
> 普通なら「<A HREF=」とか「<br>」とかを設定すればいいでしょうけど

と書きましたが
キャップを付けて書き込む場合は
NGワードが書いてあってもスルーするみたいなので
続くようならそうしますか。
最初「http://」をNGワードにしようかと思っていましたが
それよりは良さそうですし。

238 名前:名無しさん@勉強中 ★ :07/11/08 17:20:10 ID:???
ふむ
他のyykakiko使用者の所にも行っているみたいですね

http://yy48.60.kg/test/read.cgi/maru/1184900411/51-62n

名前: E-mail:
速い!旨い!レンタルサーバー

【9:845】メモ2
1 名前:名無しさん@勉強中 ★ :06/09/16 19:36:34 ID:???
これまた思いついた事など

836 名前:名無しさん@勉強中 ★ :07/07/29 13:16:34 ID:???
>>829の件

とりあえず鏡の国スクリプトで画像添付出来るタイプの掲示板をJaneで見たい場合
datを見ると、本文直後に

<> <a href="../hoge/img/11840641520001.jpg"target=_blank><img src="../hoge/img2/11840641520001.jpg" width="113" height="150" align=left></a>

となっているみたいなので
ReplaceStr.txtに

<img src="[tab]
../hoge/img2/[tab]http://hogehoge.jp/huga/hoge/img/
" width="[tab]<"

とやったらJaneNidaで画像が読めたです。
決め打ちではなく正規表現でやろうとしたらどうもうまくいかなかったのは
まだ勉強不足なのだろうなと。



で、鏡の国の場合
〜/test/read.cgi/〜 が 〜/test/read.php/〜 になってるので

/test/read.php/[tab]/test/read.cgi/

もReplaceStr.txtに付けるといいかも。

837 名前:名無しさん@勉強中 ★ :07/07/29 13:18:10 ID:???
後半間違い

で、鏡の国の場合
〜/test/read.cgi/〜 が 〜/test/read.php/〜 になってるので

/test/read.php/[tab]/test/read.cgi/

もReplaceStr.txtに付けるといいかも。


自分用メモでした

838 名前:名無しさん@勉強中 ★ :07/07/29 16:49:14 ID:???
生禿さん復旧ありがとうです

メモ
2ちゃんねる過去ログ集
http://www.ekd.ne.jp/kakolog/kako/

839 名前:名無しさん@勉強中 ★ :07/07/30 10:29:14 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1165245437/348-350n

わかんないです

ただ外野が想像するに
みみずんさん
以前ブログで「gzip送信するようにしてみました」と書いておられたのですが
gzip圧縮されたファイルを更にgzip送信する際に何かあったのかも。
「んなこたねーよド素人め」と言われそうですが。
最初にみみずんさんの所のdat.gzにリンクさせて頂く際
何個かファイルをDL解凍しても大丈夫だったのですが
今は確かに何だか変ですし。

で、htmltodatで対処出来るので別にいいかなと。
閑古鳥掲示板で伺うのも何ですし。

840 名前:名無しさん@勉強中 ★ :07/07/30 19:26:00 ID:???
メモ

FOMA90x専用2chブラウザ「W2Ch」 part26
http://hobby9.2ch.net/test/read.cgi/chakumelo/1185639957/42
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
42 名前:携帯電話情報通知しません[sage] 投稿日:2007/07/30(月) 18:09:35 ID:aHxfuL4sO
ROMると書いておいて申し訳ないが、方法はあるので書いておく。

/^.*スカッとゴルフ\sパンヤ(?!(.*(1183076939|1184457896|1183465932|1182761417|1182691287|1182083810|1146326613)))

こんな感じで。


一般可すれば、

/^.*キーワード(?!(.*(スレ番号)))

「キーワード」を含み、「スレ番号」を含まないスレを検索する。
(スレ番号) は上記のように | 区切りで複数指定可能。
新しい重複スレが立ったら追加してくれ。

ちなみに\sは余白を意味する。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−



抽出すると

【 「キーワード」を含み、「スレ番号」を含まないスレを検索】
.*キーワード(?!(.*(スレ番号)))
(省略されました・・全てを読むにはここを押してください)


841 名前:名無しさん@勉強中 ★ :07/07/30 19:29:56 ID:???
どうでもいい関連

正規表現タンってツンデレだよな
http://pc11.2ch.net/test/read.cgi/prog/1172749112/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1 名前:仕様書無しさん[] 投稿日:2007/03/01(木) 20:38:32
あれはそう、初めて正規表現タンにであったとき…
俺は正規表現タンを彼女にしようと必死に愛のアプローチを行ったが、速攻でふられた。
涙が出そうだった。
なんどもなんどもデートに誘ったり、本でロマンティックな口説き文句を研究したりした。
それが実ったのだろう。今、正規表現タンは俺にめちゃくちゃデレデレで、とても良い仕事をしてくれている。
そして俺も彼女を愛している。
俺は正規表現タンが大好きだ!!!!!

7 名前:仕様書無しさん[sage] 投稿日:2007/03/04(日) 03:27:14
非正規表現との格差が問題になっています。

8 名前:仕様書無しさん[sage] 投稿日:2007/03/04(日) 12:19:40
見て、こんなにたくさんマッチしたよ!
−−−−−−−−−−−−−−−−−−−−−−−−−−−−


> 非正規表現との格差が問題になっています

これ書いた人すごいなあと

842 名前:名無しさん@勉強中 ★ :07/07/31 16:59:30 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1165245437/351-352n

自分が考えていた方向性は間違ってなかったみたい
それにしてもすごいや('∀`;)


不具合の対処の手際の良さとか
実にすごいや('∀`;)
最近だと下のとか

http://pita.paffy.ac/bbs/test/read.cgi/pita/305/278-288n

とてもすごいや

843 名前:名無しさん@勉強中 ★ :07/08/02 19:25:04 ID:???
現在このスレッドのdatサイズが499KBのようで
また1000使い切れないみたい
中途半端だなあ
あーどうしよ
まあいいか

ところでまたミラーを10個ほど追加できそうなんですけど
どうしたものでしょうか。

「もういいよ 君は十分やったよ だからもういいよ」
というような 心の声が聞こえてくるような
そんな毎日なんですが。

844 名前:名無しさん@勉強中 ★ :07/08/03 08:29:16 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1175735168/605-607n

> #その21に1001まであると錯覚してDL後にmonament5にupしたところ、719までしかありませんでした

現時点では
その21に1001まで存在しているみたいですね。

http://mirror.s151.xrea.com/imona.php?url=http://hobby9.2ch.net/test/read.cgi/bus/1176884595/

845 名前:名無しさん@勉強中 ★ :07/08/03 22:53:55 ID:???
UNIX板より

2ちゃん画像落としまくりスクリプト
http://pc11.2ch.net/test/read.cgi/unix/1003833552/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1 :1:01/10/23 19:39
2ちゃんねるに貼ってある画像リンクを追い、
jpgをかき集めるスクリプトを作ってみました。

http://www.ninnin.net/

※perlとwgetが必要です。
※Windows,Macでは動きません。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

これwshでも出来そうです。
「UNIX板でwshとか言われてもなあ」とか言われそうですが。
http://pc11.2ch.net/test/read.cgi/unix/1164200330/148

要するに
datの中にある画像のURLを正規表現等でで引っ張り出して
ヘッダ送信して戻り値のステータスコードで存在の可否を調べて
存在している場合はダウンロードすれば良いのだろうなと。
wshならwindowsにほぼ標準で入っているので
Perlもforkもwgetもインストールしないで良さそうです。
マック使いの方もAppleScriptで同等の事が出来るかも。


それより
1さんのサイトとブログが現役なのがすごい(^^;

名前: E-mail:
面倒な設定はお任せのレンタルサーバ

【10:795】雑談
1 名前:663 :05/05/03 21:27:23 ID:4Z1XA2Xz
適当に

786 名前:名無しさん@勉強中 ★ :07/02/19 21:52:30 ID:???
ところで、geocities.jpも
拡張子txtをtext/plainで送信してくれるようにしてくれたみたいですね。

以前は 例えば
http://www.geocities.jp/mirrorhenkan/snapshot/snapshotmaeshori20061114.txt
を開くと
text/html送信(受信)して正規表現記号をタグ認識してしまってたもんで
苦肉の策でview-source表示させてたんですが
これだとIE以外ではDL画面になっちゃうみたい。
(って その後IE以外を使って初めて知りましたが)

これって、IEしか使ってなかった時分はわかんなかったです。
自分の環境(や能力レベル)が標準だと思っちゃ駄目ですね。

787 名前:名無しさん@勉強中 :07/02/19 22:11:34 ID:xiH1l4z+
>>785
そのサポート板の存在に気付いてませんでした…
とにかくありがとうございます、できました
これも「左で開けない方はこちら」となってるのに気付かないでいました…
が、IDの横の(p)とかは消せないんでしょうか?本当無知ですいません

788 名前:名無しさん@勉強中 ★ :07/02/20 20:32:01 ID:???
ちょいと余裕ないもんで
その件については明日考えるです
ごめんなさいごめんなさい

ところで

>
> IDの横の(p)とかは消せないんでしょうか?
>

もしかして
ID横の「(p)」とID右の「(3)」(同IDの発言回数)って
今までも残ってたんでしょうか?
試せばわかるだろとはいうものの
すんごくフラフラだもんで
ごめんなさいごめんなさい

あと
正規表現を見ると気絶しそうなので
わかる方に見て頂きたいのですが
どこをどうすればいいのでしょうか?
ああ他力本願
ごめんなさいごめんなさい

789 名前:784 :07/02/20 21:45:28 ID:P/4Yecw8
>>788
こんな初心者に構って頂いてありがとうございます
感謝してます
やはりサポート板のほうに行くべきですよね
すいませんでした

790 名前: ◆/vmukiyuzw :07/02/21 00:04:13 ID:ok8ktL3n
>>789
サポート板管理人としては来てくださっても結構なのですが
自分の環境では
>>785http://www.geocities.jp/mirrorhenkan/snapshot/
に書かれた通りにすればいけるのです。
もちろんIDの横の(p)とかも消えます。

なのでもう一度手順をよく確認していただきたいかなと。
あと>>785でも書かれてますが

> 駄目だった場合、そのURLを教えて下さいです

にも同感です。

791 名前:784 :07/02/21 19:56:14 ID:Omi/MKeL
>>790
手順確認したらいけました!
またくだらん間違いをしてたみたいです
ありがとうございました

それとお騒がせしてすいませんでした

792 名前:名無しさん@勉強中 ★ :07/02/21 20:00:10 ID:???
>>789
自分も初心者ですから
>>790
いつもお世話になっております


snapshotさん、広告を付けられたんですね。
とりあえず幾つかやってみたです。

ほとんど変換出来たです(ID前後も消えてるみたい)が
ただ、例えば下のものとかは
「一行が長すぎるか〜」エラーで止まってしまったです

http://p2.chbox.jp/read.php?url=http://ex20.2ch.net/test/read.cgi/gline/1165651379/all

見てみると、本文を読み込むかなり前で止まっているみたいなので
とりあえず前処理の一行目に下のを追加で読めるようになりました。

s#\t+(?:</?select|<option).+?\n##ig

後で差し替えておくです
これも広告が付いた効果なのかなとか思ったりして。

793 名前: ◆/vmukiyuzw :07/02/21 20:23:10 ID:ok8ktL3n
まあ解決してよかった、というところで、ちょっと話は飛びますが
タイミング的にたまたまってことで。

Jane用ツール総合スレ その2
http://jane.s28.xrea.com/test/read.cgi/bbs/1162473798/693,696,697

直接datを取得する手段もあるんでしょうかね?
ちゃんと調べたわけではないのでよくわからないですが。

794 名前:名無しさん@勉強中 ★ :07/02/21 21:05:10 ID:???
おお、タイムリー。

>mukiyuさん
datの位置が判れば出来ますですね。
年末にmakimo.toさんの所のログを取得するwshを作ったですが
それと全く同じ要領で何とかなりそう。
というか html取得だけなら明日にでも出来ると思います。

ただ、上のリンクの697さんの書き込みなんですが
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
既に作って使ってるけど、公開すれば『にくちゃんねる』の二の舞になるのは
目に見えてるから公開は控える。
他にもこの程度のスクリプトを書ける奴はいくらでもいるだろうが、
さすがに『にくちゃんねる』を
休止に追いやった現実を目の当たりにして、こういうのを意気揚々と
公開しちゃうほどのバカは居ないだろう。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−


> さすがに『にくちゃんねる』を休止に追いやった現実を目の当たりにして

これ 私の事をさしているんでしょうけど
大いに異議ありで
makimo.toさんの休止予告があったから出しただけですし
そもそも「休止に追いやった」ってのは間違った認識のような。

とりあえず「既に作って使ってる」というのはありそうですが
datを取得しているのかhtmlを取得しておられるのか。
この方がお作りになられたツールについては別にそう興味ないですが
datで取得しているのならせめてdatの位置を教えてもらいたいもんです。

795 名前:トラックバック ★ :07/03/03 18:37:05
【トラックバック来たよ】
[タイトル] wpacitwc
[発ブログ] wpacitwc
http://www.google.com/search?q=wwuklzul
[=要約=]
wpacitwc

名前: E-mail:
そろそろレンタルサーバを借りてみようと思ったら。

タイトル:
名前: E-mail:
内容:

いま一番お得なページ!





「もっと無料サービスならこちら」
管理者:mirrorhenkan@yahoo.co.jp
スパム対策のため「@」を全角の「@」に置き換えて表記しています。
bbs.cgi Ver.0.28.4(2008/05/28) Powered by Maido3.com