- UID
- 15141
- 斋米
-
- 斋豆
-
- 回帖
- 0
- 积分
- 7252
- 在线时间
- 小时
- 注册时间
- 2011-6-28
- 最后登录
- 1970-1-1
|
直接参照分割线内的部分 进行数字诗句创造,玩法示例,对照词频表书写:
6 W. G% _1 V; J; i& ?0 O- b; L) C' L# |$ a6 n0 b
你羡慕那些出口就会吟诗的文人吗?现在可以不用再羡慕他们了!因为一位网友“yixuan”闲来无事,把《全宋词》拿出来“捣鼓”,算出了其中的99个高频词汇。熟记这些高频词,你就可以随性所欲进行创作了!你还可以用“无序”的数字来创造一首“美妙绝伦”的宋词,圆周率也可以哦!
/ Z# d! E4 J7 }/ q- o
+ H) n2 T' d, [: ~/ N# E简化宋词就是“东风何处在人间” # C6 |0 t- K: J: n
6 K2 }1 J- x, _6 s" l' @/ ~
署名为“yixuan”的网友在个人博客里写道:“突然想看看宋词里面什么样的意象是最常见的,比如可以做个频率分析什么的。当然文本挖掘需要分词,我没法在其中花太多时间,于是想出了一个土办法。宋词的句子都很短,如果穷举可能的字的组合的话并不是太多,况且最常见的词语一般是两三个字,这样可能的组合就更少了。”比如“犹解嫁东风”这句话,可能的二字组合是“犹解”“解嫁”“嫁东”“东风”,三字组合是“犹解嫁”“解嫁东”“嫁东风”,词的字数越多,可能的组合就越少。如果把每句话可能的字的组合都列举出来,就可以整体统计频率了。”大家一致分析这位网友一定是个理科生。
* a5 E1 m( t, `% c2 ^9 p9 d --------------------------------------------------------------------------------------------------------------------------------------------------------" P2 D7 e* @2 \* W" l% N. l
4 w4 {. }6 x$ G, N* v& L1 y
随后, “yixuan”贴出了他算出来的高频词,排在前面的分别是: $ P; c8 |! S- o& O
( H1 N- ]( K4 X2 D) @Word Freq
$ K5 I+ B- N( F8 N4 w' \1 1485 % H! u& i' U6 ^) A( u: w! m/ ~
2 东风 1382
/ I$ ~6 N5 }8 w# z3 何处 1230 9 m, `$ H: `$ c+ r2 q
4 人间 1202
! o% V" z; }! @6 X; ]" V1 Y5 风流 857
1 H# H* S Z$ B; n- D% {# G9 m6 归去 812
# \3 e1 ~6 A: B! l ]7 春风 802
1 q: R7 z) S" w" X7 a8 西风 779
* L3 k$ b1 L3 z* R _. D9 l9 归来 771 M1 o/ ~% R# Q% B5 q
10 江南 765 . W. e) h' Q# p0 N1 n& X
11 相思 753
8 ?# e( z3 e+ O6 i7 D12 梅花 732 9 z5 M! w+ E" ^! w2 j# Y+ v& L
13 千里 676 % ^( n( _4 R3 s k' R, W8 O
14 回首 656
# q1 [/ M/ I8 \1 |7 y: e0 ^: p15 明月 651
: s6 L2 W- T3 q4 z3 R/ F16 多少 648 ; e) n6 @' a3 b
17 如今 642 # B& w' t6 z. ], S+ B9 Z- L+ o( u
18 阑干 630 L% S7 m# e' O. j7 y
19 年年 613
' r& ]6 \6 s! w# v3 E/ p0 {2 w20 万里 590 I4 \; M2 ?0 H& s9 M
21 一笑 582
- ]/ `6 _5 g# F' e22 黄昏 550
2 x$ Y1 R- }7 v: C23 当年 542
9 M1 N( b- O$ B) w; L5 x24 天涯 537 ; U0 S5 W) O* E( ~! W/ ]
25 相逢 528 ; y4 [9 c! f- ]! I) ]4 O
26 芳草 527 ' _7 a7 c4 {! x" F6 K6 R/ I8 }
27 尊前 516 ' ^ P, a4 O' f7 `
28 一枝 512 , Z- ~/ s- ]. h/ ^
29 风雨 505 - W* l9 ~) D" N$ `0 r* n
30 流水 472 9 `. y1 @8 p0 x/ O3 F6 q
31 依旧 472 9 t, V z$ J9 m: E5 w# V
32 风吹 471 ) I$ x* Q6 d' E0 l# V. O+ v l; h
33 风月 461 / {# ~ X$ T1 r$ t( D* u4 I6 m
34 多情 457 5 t" ]' ^% I/ Y9 I; g3 x1 r0 n
35 故人 451 $ f( V: o: r6 d& @: |: W; ^9 [
36 当时 450 3 C0 n9 Z4 c/ I) _0 U, N- K; n
37 无人 445
# v, f. }3 d6 {' p9 h38 斜阳 438 * y; W* m$ b( l; p p T3 k
39 不知 430
7 L% f0 ~- T0 B1 r7 g40 不见 429 d, H$ m! A9 c2 o. w; I8 ?
41 深处 422 * X! w* Q/ Q7 ^, l
42 时节 403
6 E* d W5 s* R8 P: d43 平生 398
# k' Y9 E# v3 u) W44 凄凉 398
3 S9 d( L& c [/ I& j45 春色 394 / O) J7 }0 h% X3 c- F- x
46 匆匆 383 $ D7 L( Q+ i |( o1 b* |
47 功名 383
" ]2 a. _1 B% ]1 \48 一点 378
( | z" K$ V' N" I5 L49 无限 377
+ a1 ]7 c$ c4 q' k# K' c. \/ y50 今日 369 5 m8 h/ s; x. u
51 天上 368
+ n. u* p7 t& e" f$ r: Y52 杨柳 362
( q+ x6 {8 F8 u( p53 西湖 356 : R, z& ~8 y2 j8 _7 j9 K: D
54 桃花 354
) }7 Y8 V1 g" H, }% O& ?' q0 ~7 ^55 扁舟 353 : B8 w2 M3 q6 \9 A
56 消息 351
* B4 q+ v1 D. q, v- H9 z9 ^! R57 憔悴 344 - v: O4 \6 k# E" e2 L9 _9 U; o, y* J
58 何事 339
9 g: s8 E0 I0 `0 t2 B6 u* F59 芙蓉 338
- c: z# c8 q! a9 E( o+ g60 神仙 334
# k1 `7 C7 N3 ` h" x61 一片 334 0 g0 f/ b; Q& U4 f2 f& n
62 桃李 333 * L# v" S9 C& I$ A
63 人生 332
C4 Q1 u8 J& K0 @/ v64 十分 331 ! J, T- c; ]( u P9 ?
65 心事 329 & n$ s; y: V1 r4 I0 l
66 黄花 328 3 f2 S" v& C5 `& j6 c- a
67 一声 325 8 |9 i" N7 [4 _$ M% M, O4 N0 d+ h: o
68 佳人 324
# |/ A( `. e: H$ f) b/ _1 X69 长安 321 * D! I# I8 f }) q/ v3 t( C1 d6 ?
70 东君 319 / j) t" S+ D. h2 k( R* B
71 断肠 316 : D; q" g. P$ C$ C/ J6 c. L1 f$ t
72 而今 315 - h- R% Q7 U& h4 ~6 i4 _) C) w
73 鸳鸯 314
' u2 Z9 Y, r4 P3 k74 为谁 313
- n- t9 X) [( I4 H" v75 十年 310 % {* f- G4 s: I
76 去年 309
( \1 i1 a9 o) U5 M1 C' r77 少年 308 # i) m- H Q. x! B4 G0 m! y
78 海棠 307
( i6 R# e) ?4 N$ ]79 寂寞 306 ( ~) Q) \" G7 U( x# c
80 无情 306
4 o4 r# O! Y/ ~! ~, F0 Y2 a' V81 不是 305
0 D1 r; p3 g8 J& y0 X ~( z3 V N82 时候 304
) Q* U+ Z" H5 e* Q1 G83 肠断 303 ; a7 f4 P- U- D- p. m( k
84 富贵 303
+ k8 C8 F3 b1 |) y9 w4 K) M: ^85 蓬莱 303 7 g- m$ G ^& j: E) l- x* V
86 昨夜 303 - l3 q, s# T, ]: B
87 行人 302
+ P3 a4 c' E- J/ b4 P. B! u- o0 f88 今夜 301 2 ], ` ]4 a2 X( X
89 谁知 300 ( n& E/ r& N3 ]' y! {! k
90 不似 299 1 i$ b% o# z2 }! _2 H m
91 江上 298
% D2 \3 @; {. L& E% B( \92 悠悠 296
' ^" f# l$ |9 s$ h G. k# I93 几度 295
/ H0 W+ r% a* L- Y+ v6 N( Z) L94 青山 295
8 N" l9 k+ S3 S' S7 v% ~95 何时 294 , [' w, x8 d& f9 E' ?: B
96 天气 293
7 |! g: Y- q+ z$ y/ D+ J# @/ I6 v) ^97 惟有 293 ; q9 L9 x% i6 v. u! Y% z
98 一曲 291
0 r& ?1 _% }6 l99 月明 291
% L+ Y. a2 a! w2 O100 往事 290
7 D9 D; R4 M+ t- U( I2 ^* Y& [* U: q( O1 q
至于为什么第一名是数字,他解释:“排在第一的是无效字符,这跟数据源有关。” 5 l9 m+ M# W+ U; k" R
1 p0 x9 s& i. O9 N G [这个结果一出来,一位网友就一语道破了“玄机”,“原来,最流行的宋词就是‘东风何处在人间’啊!”
" \% P% w" F! O+ e+ M# t+ c. a: T4 d+ ]# J; g
生日、手机号 随意组合都很美 1 O% K2 e* u9 R' O# C" P
0 v: p/ c' b/ ?$ D
还有更绝的呢!署名为“达芬奇的鸡蛋”的果壳网友不知怎么地,就想到了拿大家都会背一点的圆周率进行创作,两个数字一断,对照高频词表,一首“华丽丽”的词就出来了!还附上了说明,特别像模像样。4 @6 @4 U' ~/ m# X% h9 l+ {' ~1 c4 H
0 p2 m& _: ~2 T# Q; M# K+ P( g
# V% T3 c" s& D. ~8 |
玩法示例: ' u i4 c9 H2 b# t3 T" t
--------------------------------------------------------------------------------------------------------------------------------------------0 q! J5 Q* A6 q5 W9 m, e& f3 s
% t3 V9 m! B' E1 p/ r V
达芬奇的鸡蛋 @ 果壳
( P1 `+ ?2 s; x4 g! `* p
& q& x) E, {4 ~9 x' a3 T清平乐·圆周率
" G7 w7 j+ H# M* _8 p d1 p0 C" U4 B& e0 R$ y+ u2 R) j) o9 e; L
回首明月(一看就是抒情诗) , p0 N+ l8 d9 D( G' p$ {
14 15
0 S, a, y7 F+ n+ P( J7 Z7 X) i悠悠心事空(果然,貌似失恋了) ) a, P: N' T2 K: V1 t5 d
92 65
" A, C/ W& e; I! ?西湖何事寂寞中(触景生情) 3 W4 r( X: Q/ z- J
35 89 79 6 Z7 w# N6 N) z6 W6 Q
风吹斜阳匆匆(回忆那天下午的艳遇)
! Y3 e1 h" |. b( U* d6 W32 38 46
5 r+ F% y0 M0 w# ~6 W! ?' f' E9 I& f& n- l8 c& \9 ?0 [
芳草平生斜阳(平生见过最美的太阳和芳草,都是因为那里有你的身影) 3 Y, \) E l z2 F, P2 w
26 43 38
: R+ I; V/ H" ?# j' S$ v5 ^风吹寂寞今日(到现在就剩我自己) 0 Z- y; K5 G' P" A# a% d! b7 n3 W
32 79 50 ' A& G0 D% d; `5 v2 Y
一枝富贵年年(好花美丽年年开,好景宜人不常在) 6 H& D: p; L7 ]/ C) X
28 84 19 & K* w* J+ L% |3 a6 w/ c5 t
断肠长安不知(我的思念远方的你可知道?) % ~1 h J+ C2 q( ?. t. K
71 69 39
2 }4 }5 T, l, r; a. W5 h: ^) M& U3 [. W) S
如梦令·根号二
$ y1 ^, G1 g" h2 M. E* _0 k
* G0 h% d0 P3 v深处时节千里(过了许多年,男猪脚来到了很遥远的地方) : [8 h- H) p- I ~2 N- u) R
41 42 13 7 {# e/ o f d) s9 z8 R& ~
消息当年鸳鸯(这。。找老相好去了?) 4 m& X0 P1 L- k+ W* s- G
56 23 73
8 E7 O( I5 G4 @归来今日(妹子,我胡汉三回来啦) - E* d" g/ {6 F, i
09 50 6 L) {9 Z7 c w! g/ v: P& T" g1 a
一点无情多少(你还知道来看我啊!)
8 I5 j4 i! H* C3 P48 80 16 0 V3 y ~+ ]- o( q" X
今夜,今夜(要出问题了。。。) . U9 R4 j8 u- R9 k. \8 R/ C* c
88 88 : Y( F" U7 I5 Q7 l8 V5 \. f* D
而今时节归来(仿佛重回当年,男猪脚依然那么坚挺)
7 U& y4 j) U; X! r* T72 42 09
9 m, q' a3 h9 y' y9 j5 p/ s6 r9 B: C# G
6 t7 `" H& D, N/ F$ t) Q/ I. f4 Y
网友评论部分
, p6 Y* Q# d+ ]0 Y' [/ r: \6 j----------------------------------------------------------------------------------------------------------------------------------------------1 A5 }" {" n, u9 B
( V' |: U" b% t. B8 T) g0 x' K
看完这首诗,网友们一边膜拜,一边自己的创作灵感也被打开了。
( P- Z, H* O- e0 A7 [
9 K3 E& u9 H$ X“丘寒”留言道:“试着用某个号码创作了一首:天上相思,芳草年年,昨夜江南,回首一笑多情。”
& `6 T' W4 p1 l: B6 R& H“零Ronnie”很有创作激情:“我的生日:年年江上,江南春风;我的手机号:明月芳草去年,江南阑干归去……还真挺上口的!我也能做诗人了哈哈!”
6 Q6 k1 {3 f4 E
m' x1 P, K& e; @/ z理科生欢呼:消灭文科生的日子来了
/ p, ^# K; o" Q7 M2 ?3 M! G4 z5 \ v
可是这么一来,文科生又不淡定了,一群文科生跳起来反击。 1 p! z1 {& O u$ Q
. h/ a& A- W! U1 X3 G; x F
“雯名霞迩”大叫:“统统拖出去,斩了!这让学中文的人情何以堪啊!”
' j: X5 z. c) \& t# Z“Rockfish”代表理科生还击:“理科宅男们消灭文科生的日子到来了!拿起你的计算器,消灭文艺青年吧!” + O$ @) d2 Q* M) q" }6 J/ _4 M
“可可”童鞋呼唤:“就让科技小清新来得更猛烈些吧!”
9 A3 u, G- m+ E3 _
& U% d% @- D. X& f7 ]. ~3 L还有一群网友七嘴八舌讨论着。
, z9 j8 H! G F5 o! v! {7 G% ]
5 Y) h0 e) A& p) ~) s" ]“沌世界”淡定地说:“不知宋词的粉丝看了是不是有一种偶像破灭的感觉。” ) t4 ^( z u' q& L8 t0 x5 `) q& x
“家杰仕”童鞋也总结道:“文艺男女已经阻止不了技术宅作诗了!”
& _; K3 j9 H. V8 k- c, [' z) ?网友“Rakin”点评:“理科生文艺得真凶猛!”
5 t* e; e/ l6 z+ k7 _“焰心Spring”呼吁:“想文艺一回的同学请转!”
. \% Y: z0 ], A2 V1 D“ChanIm”表示:“当时学写诗的时候超鄙视这些,现在淡定了,因为没那么多愁善感了。” & c+ m5 D, C3 @* y& r' s. x
“思念的秋天”感慨:“穿越必备!” 6 @! V5 o2 T" c* F
“NetCharm”说:“背熟了,随便组合一下,写出来的也不会太烂。” * H4 U0 _2 r0 p2 x9 L
“huahualipo”童鞋还提出了意见:“高人,能不能把平仄也加上……如果平仄太困难,至少考虑一下词尾押韵如何?韵脚也就十来个,每个都分配一个数值,然后每隔一行,末尾的词就只从一个值下选。这样会大大增加仿真度啊!”
+ G9 P9 Q( J. K& M" W! y) ]5 `
3 P, z, i7 X* c/ Z8 I/ R' X) b再次神经短路,突然想看看宋词里面什么样的意象是最常见的,比如可以做个频率分析什么的。当然文本挖掘需要分词,我没法在其中花太多时间,于是想出了一个土办法。宋词的句子都很短,如果穷举可能的字的组合的话并不是太多,况且最常见的词语一般是两三个字,这样可能的组合就更少了。比如“犹解嫁东风”这句话,可能的二字组合是“犹解”“解嫁”“嫁东”“东风”,三字组合是“犹解嫁”“解嫁东”“嫁东风”,词的字数越多,可能的组合就越少。如果把每句话可能的字的组合都列举出来,就可以整体统计频率了。
# Y! S: D+ Y+ ~& Q* S
9 O# j- v& }: x- i, s
- g5 y1 w- \. W0 x8 G$ T& [, `. I; K9 c0 l# r
当然里面会有很多无意义的字的组合,不过这类“词语”本身的出现就是一个偶然,所以可以预期的是它们整体的频数会很低,是入不了“大雅之堂”的。话不多说,直接上代码和结果。
2 J5 m2 Y$ P# r" G. ~+ @
t# S- S4 n' _" ?" u$ e0 J" }# }( y9 M3 `/ }
内容很多参照自:http://blog.renren.c​om/blog/326678730/78​5811432
: g: }% J, g# h1 Q) R4 P' A: V0 R3 I1 y9 c' v
0 C4 {5 N& u* T6 q- V咩哈哈哈哈哈~~理科万岁
5 n( N# f2 G+ g# |1 w: ~) A* p
* I0 W# }* n; M" G3 i; a; Y3 W2 ^) l$ t8 U; Y1 M: I8 ^- m
|
|