NJU hides on everybody’s keyboard!
It’s fun~
Simple Dream Easy Go~
在央视CCTV8热播电视剧《国家机密2》中,我们惊奇的发现了魔兽争霸3的身影。具体情形如何,请看如下视频:
很多问题,归根到底是个图论的问题。比如最近在做的Customer Segmentation.
从会员的behavior 可以做出会员的 interests vector,通过计算i,j的similarity( i, j )得到similarity matrix 下面在处理下,细分成Group就解决这个问题了。
我在怎么画一个示意图来阐述我的方法的问题上遇到了麻烦,最后想大家隆重介绍:graphviz
主页设在http://www.graphviz.org,你可以在这里下载到最新的Windows版本。安装后你可以在dos下(任何目录中)调用它的命令行模式。
这里,我们使用dot语言。官方网站上有关于dot语言的详细的用户手册。

这么一个图就是用一段代码画出来的
最上面那个狂大的图就是我用graphviz画的,当然:手写代码效率是很低的
这么写也许会快很多:P
[code]
fout<<"dot -O -Tgif\ngraph G{\nsize=\"59,1711\""<<endl;
//atoi [color=green];
for( i=0;i<59;i++)
switch(user[i]){
case 1: fout<<i+1<<" [color=green];"<<endl;break;
case 2: fout<<i+1<<" [color=blue];"<<endl;break;
case 3: fout<<i+1<<" [color=gray];"<<endl;break;
case 4: fout<<i+1<<" [color=red];"<<endl;break;
case 5: fout<<i+1<<" [color=orange];"<<endl;break;
case 6: fout<<i+1<<" [color=brown];"<<endl;break;
case 7: fout<<i+1<<" [color=hotpink];"<<endl;break;
case 8: fout<<i+1<<" [color=yellow];"<<endl;break;};
for( i=0;i<59;i++)
for(j=i+1;j<59;j++)
if(matrix[i][j]==1)fout<<i+1<<" -- "<<j+1<<";"<<endl;
fout<<"}"<<endl;
[/code]
对于想要把图论的题目画出来的同志们可以试试这个。
另外一个更强大的工具叫UBIGRAPH,这个可以在C++ Python Java等主流语言里面无缝的对接,不过既然上面的已经够用了,以后再研究吧~
URL Links:
在杭州实习的感触很多,以后慢慢总结来。
// 最近一直在陶瓷和写Paper 还有做项目中渡过。每天加班到夜里11点半(昨天夜里4点钟回来的。。)然而始终觉得还是很愿意去念一下PhD,专心的做做Research一段时间的。而且几个US的老板也陶瓷比较愉快,不过GRE Score是necessary的。6G被我Cancel掉了现在觉得超级后悔, 当时应该咬牙坚持下来才是王道。
不过既然这次也报名了,就先这么准备吧。 由于没有招行的信用卡,用的别人的卡。结果那哥们给报了一个8月27号的机考。。 还有10天不到那!!
这不是想让我死么。。
不过压迫压迫可能也是好事 10天就10天。。。
老子拼了。。。好歹有iBT的基础,虽然是去年这个时候的事情了
———————————-
10天也是需要一个安排的
Day 1(Sun):制定计划[1hour];搜集最新的一些资料,分类存放[2hours]。通读200道 issue题目(中英文) 并作出分类[2hours];就最近的高频,把高频的中英文题目整理好 分类 选好相应的范文待用。[2 hours] 通读Gter和Taisha精华区最近一年来的帖子。[4hours]
———— > Done ! 睡觉【08.18 02:13 AM】
Day 2(Mon):联系ETS, 看机考的时间可以调整不[30 min],整理Argu的题目和分类[2hou rs],列举出常用的逻辑错误和方法[2hours],写出模板[1hour]delay,背诵一片Argument范文。[1hour] 总结Argument常用的转接词 和 Argument的高分技巧。[1hour] 写作Argument×1 限时1小时。总结Issue分类1.[1hour] (奶奶的还要工作8个Hours…)
———— > Delay! 睡觉 【08.19.03:12 AM】
Day 3(Tue):背诵一篇issue范文(2 hours),总结issue分类II(1hours)。写一篇Issue 限时1小时。复习Argument模板(1) 复述Argument范文(1)。阅读分析Argument 范文II(2)。
Day 4(Wed)–Day 6(Fri): 练习,每天2issue 2Argue(4 hours total)。请人改(Y MQ、PJW等) 控制时间!(review 需要4hours)
Day 7-Day 8 Review: Review 做过的准备(总计10hours),提炼自己的模板(5hours)。熟悉背诵自己的论据库 和 转接词库。看别人写的文字 每天1 Issue 1 Argue: 重点关注高频。 列出高频提纲和论据。(10hours)
Day 9- Day 10:Mock 考试(2hours),回南京(6 hours 期间背诵打印的范文) 总结考试注意点(向牛人甲乙丙丁请教), Review,每天1 Issue 1Argue(2 hour in total)
—————————————–
在绝望中寻找希望! 大家保佑我能活着挺过来。。。
数学有时候挺可爱的,而且做数学的都特别像孩子,因为他们接触的是世界上最纯洁有序的世界。废话不多,几个冷笑话。
(一)
常函数和指数函数e的x次方走在街上,远远看到微分算子,常函数吓得慌忙躲藏,说:“被它微分一下,我就什么都没有啦!”指数函数不慌不忙道:“它可不能把我怎么样,我是e的x次方!”指数函数与微分算子相遇。指数函数自我介绍道:“你好,我是e的x次方。”微分算子道:“你好,我是d/dy!”
(二)
一位农夫请了工程师、物理学家和数学家来,想用最少的篱笆围出最大的面积。
工程师用篱笆围出一个圆,宣称这是最优设计。
物理学家将篱笆拉开成一条长长的直线,假枥榘视形限长,认为围起半个地球总够大了。
数学家好好嘲笑了他们一番。他用很少的篱笆把自己围起来,然后说:“我现在是在外面。”
(三)
一天,数学家觉得自己已受够了数学,于是他跑到消防队去宣布他想当消防员。
消防队长说:“您看上去不错,可是我得先给您一个测试。”
消防队长带数学家到消防队后院小巷,巷子里有一个货栈,一只消防栓和一卷软管。消防队长问:“假设货栈起火,您怎么办?”
数学家回答:“我把消防栓接到软管上,打开水龙,把火浇灭。”
消防队长说:“完全正确!最后一个问题:假设您走进小巷,而货栈没有起火,您怎么办?”
数学家疑惑地思索了半天,终于答道:“我就把货栈点着。”
消防队长大叫起来:“什么?太可怕了!您为什么要把货栈点着?”
数学家回答:“这样我就把问题化简为一个我已经解决过的问题了。”
7月31号,MSRA上了一个新的项目 叫“人立方”。能够根据人名和搜索关键词之间的关联度给出一组按照关联度由大到小的人名序列。这种序列的方式只能够展现每一个列出的人名与搜索关键词之间的关联度,而无法阐述人名之间的关联度。搜索关键词和搜索结果人名之间的联系以及搜索结果人名之间的相互联系织成了一张“关系网”,它蕴含了更丰富更立体的信息。人立方关系搜索的“关系图”功能恰恰是为呈现二维“关系网”而做出的全新尝试!
人立方关系搜索的“关系图”(下面简称为关系图)根据搜索关键词和与其相关的人名之间的关联度强弱自动的计算每一个人名与关键词的距离以及其自身大小;同时,关系图还根据人名之间的关联度计算出每一个人名的摆放位置;然后用连接两个人名的一根细线表征它们之间所存在的联系。关系图在位置摆放的计算过程中尽可能的使关系紧密的人名被放置在邻近的位置,但是并不能严格保证邻近即关系紧密。为了让您更容易区分图中不同的区域,关系图以搜索关键词为极点,对位置处在不同极角的人名设定了随着极角渐变的颜色。

关系图中的每一根连线都代表了其两端人名或者搜索关键词之间的联系,这种联系可以由某个词语所描述,例如“父亲”。这样的联系描述都是人立方关系搜索引擎自动地从互联网中抽取出来的。在关系图中的连线上悬停鼠标,即可以看到联系描述词,但是关系图并不保证所有的连线都拥有这样的描述词。

关系图不仅给出描述联系的词语,还可以提供描述联系的网页链接以及网页摘要。您所需要的只是点击连线即可。

关系图在左侧提供了一个控制板,其中放置了移动、放大、缩小、链接地址分享以及帮助等按钮。通过移动和缩放,您可以调整关系图整体的位置和大小以方便您浏览。将鼠标放置在空白区域,通过拖拽也可以移动关系图;如果您的鼠标有中键,您还可以通过滚动中键来缩放关系图。

您还可以分享搜索结果给您的朋友,只需要复制链接地址然后转发即可。

关系图提供了方便的导航功能,单击除当前搜索关键词之外的人名将直接以该人名为搜索关键词进行新的搜索。另外,为了方便您了解更多关于人名的信息,您还可以点击“关系搜索”跳转到人立方关系搜索的结果页面。

这个是个非常有意思的尝试,Web Mining在逐渐从学术界走向应用。不过比较起这个,我觉得Alipay的数据库里关系更加的具体。今天和子陵说了下,好似他觉得比较异想天开。但是的确现在有这个需求了,以后会更明显。还是利用闲下来的时间再琢磨琢磨吧,谁给我点灵感哈!