`
文章列表
Manifest.MF文件示例:   Manifest-Version: 1.0 Main-Class: com.fhqiwcw.crawler.framework.CrawlController Class-Path: lib/commons-codec-1.4.jar lib/commons-collections-3.2.1.jar lib/commons-configuration-1.6.jar lib/commons-lang-2.6.jar lib/commons-logging-1.1.1.jar lib/htmllexer.jar l ...
在eclipse中默认将log4j的配置文件放在src文件夹下,程序可以直接读取到配置文件,并以配置文件的配置输入日志。 但是在将程序发布是,默认log4j的配置文件也要一同被打入jar包才可能被读取到,要想将log4j的配置文件放在jar包外可以通过以下的代码手动指定log4j配置文件的位置, 将以下代码放在main函数所在类中:   static { DOMConfigurator.configure(System.getProperty("user.dir") + File.separator + "conf" + Fi ...
Unfuddle 没有聪明的思维,就象没有腊烛的灯笼。200MB的免费空间,界面友爱,特点雄厚,支撑Git,但只能一个账户一个用户并且只容许一个项目,付费办事相对来说价格偏高 CodeSpaces 内容充分的生命就是长久的生命,我们要以此为而不是以时候来衡量生命。500MB,一个账户两个免费用户,付费办事价格公道吧,貌似如今免费的就45天 Assembla 200MB,很有特点,项目有维基,博客等等,支撑Mercurial,但免费版只支撑开源项目,不过付费办事价格很轻易接管 OpenSVN 免费容量不限,项目数量不限,不成靠,╮(╯_╰)╭没特点 XP-Dev 免费的20 ...
  星期六 2007年09月01日 org.htmlparser.util.ParserException: Error in opening a connection to ***   使用HTMLparser时碰到一个错误 org.htmlparser.util.ParserException: Error in opening a connection to java.io.IOException: Invalid argument  at java.io.WinNTFileSystem.canonicalize0(Native Method)  at java.i ...

log4j.xml配置详解

log4j学习笔记: http://heavyz.sourceforge.net/homepage/homepage_zh/comp/notes/log4j.html log4j详解: http://www.blogjava.net/hwpok/archive/2008/08/23/223891.html   <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE log4j:configuration SYSTEM "log4j.dtd"> ...
  [\u4e00-\u9fa5]*
  JavaScript: function isURL(str_url){ var strRegex = "^((https|http|ftp|rtsp|mms)?://)" + "?(([0-9a-z_!~*'().&=+$%-]+: )?[0-9a-z_!~*'().&=+$%-]+@)?" //ftp的user@ + "(([0-9]{1,3}\.){3}[0-9]{1,3}" // IP形式的URL- 199.194.52.184 + "|" // 允许IP和DOMAIN ...
将异常栈写到日志中     public void add(Role role) { try { this.roleDaoJdbc.add(role); } catch (Exception ex) { String msg="Caused by: "+ex; StackTraceElement[] trace=ex.getStackTrace();; for(int i=0;i<ex.getStackTrace().length;i++){ msg=msg+"\ ...
多线程中线程常常会因为抛出RuntimeException终止   考虑如下的场景:一个线程用来接收外部系统的输入(输入线程),当有输入时用调用notify()唤醒另一个输出线程,将输入内容转存到另个的系统里。 当输入线程因为RuntimeException异常退出时,输出线程就不会被唤醒。这样因为一个线程的死亡影响到其它线程的正常工作,甚至会影响到整个系统的动作。   好在java中提供了线程在抛出未捕捉异常时的处理机制UncaughtExceptionHandler 以下代码片断展示了如何在线程抛出未检查异常时重新启动一个新线程 另附上线程组的处理方法:http://www.i ...
最近做项目用到了nekohtml+xpath nekohtml将HTML文档解析为标准的DOM,再用XPath从DOM中抽取想要的结点。 nekohtml比起htmlparser还真是简单,但是简单就意味着不透明,出了错就不知是什么引起的,这一点真让人受不了。 下面先说说nekohtml+xpath的使用注意事项: 1.nekohtml会自动将html的标签转化为大写,因此写XPath时要用大写 //div 错误 //DIV 正确 2.用XPath处理时标签前要加命名空间,否则找不到结点,这里就要用到NamespaceContext这个类   class MyNamespa ...
    String url = " http://fhqiwcw.iteye.com/admin/blogs/1450540/edit ";        String regexp = "((http[s]?)?(://))?([^/]*)(/?.*)";                //方法1        System.out.println(url.replaceAll(regexp, "$4"));                //方法2        Pattern p = Pattern.compile(re ...
  今天用springMVC接收表单中文数据时总量乱码,按照网上的解决方案设置过滤器后,post的表单不乱码了,但get的表单还是会乱码。 解决get方法乱码的方案是修改tomcat的server.xml配置文件,修改<connector>如下,加入字符集编码:   <Connector connectionTimeout="20000" port="8888" protocol="HTTP/1.1" redirectPort="8443" URIEncoding="UTF- ...
先提供源代码,过程以后再慢慢写。 工程导入eclipse 数据库脚本导入mysql
最近几天在学习compass 其中的示例项目PetClinic部署起来还真是麻烦,所以将打包的好项目发上来(包含源码),用Eclipse导入工程即可。 数据库用mysql(请自行修改jdbc.properties文件)。
[转载]http://blog.csdn.net/historyasamirror/article/details/6706174   虽然打着Heritrix的名头,但本文更多的还是谈谈增量抓取的基本思想,Heritrix只是正好被用来做为例子。   如果你不是随便写个爬虫抓着玩,那么一定会碰到一个问题, ...
Global site tag (gtag.js) - Google Analytics