Xiangyu's profile* Learning To Fly *BlogListsGuestbookMore Tools Help

Blog


    27 April

    欢乐谷玩儿命归来,游记稍后奉上~

    昨日归来,今天打球,累了,歇歇再上游记~

    25 April

    Holiday Comming :)

    这长假从今儿起就算开始了,可真是长啊~

     

    论文要尽量写完初稿,代码也要多写一些~

     

    嗯,暂时就这样。

    22 April

    祝贺火箭赢下首轮第一场~

    不容易啊,看了上半场还以为今儿没戏了呢。不过好在麦迪及时苏醒~

     

    上半场几乎全靠姚明顶着,下半场麦迪顶上,不错,一场经典的反击战 ;)

     

    希望下场好运~

    19 April

    乱码啊乱码……

    破Nutch ……一个乱码搞得我几天没有进展……

    找遍了网上所有解决乱码的方法都没有用,快要崩溃了 :(

     

    Cutting,救救我吧……

    17 April

    Good News

    今天通过了OCW的试译 :)

    它说我申请的课程有60多个PDF,怕我坚持不下来,让我要考虑好……

    还是上吧,好机会,只是这个教授问题还要解决一下……

    Nutch 0.9 Released

    2 April 2007: Nutch 0.9 Released

    The 0.9 release of Nutch is now available. This is the second release of Nutch based entirely on the underlying Hadoop platform. This release includes several critical bug fixes, as well as key speedups described in more detail at Sami Siren's blog. See list of changes made in this version. The release is available here.

     

    也不知道这个新版本能不能解决我们的问题。

    16 April

    听君一席话,胜读十年书

    以前总觉得这句话说的有点儿过,今儿晚上开完会才知道——真不是盖得。

     

    孟老师说,别人的东西可以拿来看,但是等从你那里出来的时候一定要是自己的东西。

    说的太对了,别人的文章展现给我们的是他们所看到的东西,我们可以拿来看,但是一定不能被牵着鼻子走,他们所呈现的只是事物的一个侧面,起到的只是一个带路的作用,我们要做的不仅是看清楚这个侧面,而是要借助它来看清全貌。

     

    所以千万不要傻不楞登的把别人文章上的原话写道你的文章中去,一定要升华。

     

    切记~

    无尽的等待……

    说的下午开会,这都快五点了还没动静……

    无奈呀~

    15 April

    Exhausting Sunday

    早上来和姜老师处理了一下审稿的汇总结果,本以为跑一趟程序就解决的问题还出了些问题,诡异的问题。

    姜老师给的审稿模板已经很清楚了,可是偏偏有人要自由发挥,不是不写题目,就是篡改结构,结果报了几个Exception,还有一些需要手工修改。

    看来这标准的制定还是非常必要的。

     

    中午和王sir在颐和园的西贝吃了顿饭。北京的西贝档次还真是高,菜也很不错,就是贵了点儿……

    吃完饭送走王sir,无聊的我们又去颐和园溜达了一会儿,累呀……

     

    还是实验室舒坦,歇会儿……

    14 April

    Gloomy Saturday

    I said it's best to keep this from the public before we can make something that really counts, but nobody was listening ...

     

    Pro.Meng was right on how we should work on this subject but I just don't know how to put it to practice.

     

    Maybe file system can be a nice entrance for me, but there's already papers on that including iDM.

     

    Anyhow, I just wish for one tiny thing : today was the last time I get this embarrassed.

    做研究的目的

    今天会上孟老师说了今年DASFAA的一些情况,其中提到日本近年来的论文数在下降,孟老师在泰国与日本学者进行了交流。

     

    日本人提出的原因是他们今年来做的研究越来越不DB了,而是和日本的工业界结合比较紧密的一些东西,这样做的后果就是paper少了,但是同时却使得学术与工业很好的结合了起来,可以说是将paper更有力地转化为了

    生产力。

     

    而我们呢?每年的paper数量在“非线性”增长,可是其中有多少能贡献于工业呢?怕是不多。

     

    孟老师说的对,SIGMOD之类的会议上的Session是美国工业界需要的东西,所以我们费那么大劲只是在给鬼子输送idea---也就是说我们在以能够给鬼子送idea为荣……想想很是可悲。

     

    当然我也知道这不是一天两天就可以改变的东西,但是我是衷心的希望我们的研究可以有一天能够最大程度地贡献于生产力 ---毕竟这才是研究这回事儿的初衷。

    13 April

    Idea 啊 idea ……

    Idea这个东西从来都是来无影去无踪。

     

    昨天的讨论很有成效,但是很不完善,有诸多需要完善的细节,这些细节关系到这个模型的合理与否,也关系到下面的工作如何进行,很紧迫啊。

     

    明天小艾就要报告了,可是我对我们的Future Work还是不太满意,因为还是不太完善,希望孟老师不要太计较,毕竟我们才刚上路嘛 :)

     

    报告以后就要准备具体的工作了,要加油啦 ~~

    12 April

    双“喜”临门

    今天是以悲剧开场的:没吃早饭,没吃午饭,什么都没吃去打了一下午篮球,差点饿晕……

     

    不过事情在却晚上发生了戏剧性的转变……

     

    先是DS小组的讨论颇有成果,有了突破性进展,此为一喜。

     

    然后……这个东西不知算不算是“喜”:八年前投的中国银行居然给我发来了笔试通知……

    有点受宠若惊啊,就是有点远,丰台……

     

    不过还是去看看吧,长长见识去 :)

    提纲啊提纲……

    这个毕设提纲还真不好写,不过主要是因为我的题目属于比较研究类的,不象工程性的东西那样,有个执行步骤啥的,我这本来就难写,这提纲就更是重中之重,惆怅啊……

    不过还是要写啊,争取本周内搞定!

    看到的都给我祈祷吧:)

    11 April

    Nutch 啊 Nutch !

    今天无意间居然解决了Nutch一直困扰我们的一个问题,就是那个crawl时数据的归属问题,哈哈哈,what a genius I am ……

     

    其实Nutch所显示的路径是HDFS下的路径,并不是我们本地文件系统的路径,所以我们以前无论如何是找不到的,而只有在执行Hadoop命令时那些路径才会起作用,也就是说HDFS以它自己的机制进行着存储,那些路径不过是给我们看的而已。

     

    今天还明白了一个问题就是hadoop-site.xml中的那连个local的含义。

    第一个local并不是指本地机器,并不是网络中那个local的含义,而是和HDFS相对的本地文件系统

    第二个local指的是只用本台机器来进行Nutch的工作,也就是把一切任务都只在本地跑。

     

    Great day. isn't it ? :)

    Hierarchical Revival

    刚才和小艾讨论了一番,隐约地嗅到了层次模型回归的味道。

    看来轮回之说还是有些依据的,起码现在别的模型似乎都不能满足需要了,难道层次模型的鬼魂正在悄然降临?

     

    让我们拭目以待:)

    Parser 啊 Parser ……

    上午和师姐推敲了好一阵子终于把那个破Parser的结构弄清除了一些,不过还是有个Meta和一个MetaTag不大清楚是怎么回事,回头再看看吧,主要内容基本搞清楚了,希望可以尽快进入编码阶段。

    加油 !

    10 April

    Pick Up the Forgotten Gun

    I've been more and more faithful with the graph theory these days since it seems to be one candidate for our problem.

    I'm not sure how far it can take us but for now it seems the only available try.

    It would be great if we can combine Relation and Graph theories into a advanced method, but that will definitely take so much even if it works.

    Learning to Fly

    To My 21st Birthday

    Get ready

    I'm learning to fly.

    03 April

    Paper……

    快要崩溃了……
    感觉就像在苍茫的草原上,无数的骏马飞驰而过,可我就是抓不住任何一匹……
    —*……¥—#啊,救救我吧……