- UID
- 15141
- 斋米
-
- 斋豆
-
- 回帖
- 0
- 积分
- 7252
- 在线时间
- 小时
- 注册时间
- 2011-6-28
- 最后登录
- 1970-1-1
|
直接参照分割线内的部分 进行数字诗句创造,玩法示例,对照词频表书写:
+ g o" T8 f# ~4 j, H( s$ M* Q- P
你羡慕那些出口就会吟诗的文人吗?现在可以不用再羡慕他们了!因为一位网友“yixuan”闲来无事,把《全宋词》拿出来“捣鼓”,算出了其中的99个高频词汇。熟记这些高频词,你就可以随性所欲进行创作了!你还可以用“无序”的数字来创造一首“美妙绝伦”的宋词,圆周率也可以哦!
; \1 v6 n, A% ?' c 8 q, _% N" b6 p) X4 R7 ]0 j
简化宋词就是“东风何处在人间” . }+ \; m. Y/ l
( n; i3 A, L# P5 ]% O
署名为“yixuan”的网友在个人博客里写道:“突然想看看宋词里面什么样的意象是最常见的,比如可以做个频率分析什么的。当然文本挖掘需要分词,我没法在其中花太多时间,于是想出了一个土办法。宋词的句子都很短,如果穷举可能的字的组合的话并不是太多,况且最常见的词语一般是两三个字,这样可能的组合就更少了。”比如“犹解嫁东风”这句话,可能的二字组合是“犹解”“解嫁”“嫁东”“东风”,三字组合是“犹解嫁”“解嫁东”“嫁东风”,词的字数越多,可能的组合就越少。如果把每句话可能的字的组合都列举出来,就可以整体统计频率了。”大家一致分析这位网友一定是个理科生。
! C8 e1 g+ p% I, C! B# z0 Z/ D --------------------------------------------------------------------------------------------------------------------------------------------------------
@# [. H/ Z% v! n$ k! L! G' H' ] y5 f " @( P& `: P& f3 ~4 | U
随后, “yixuan”贴出了他算出来的高频词,排在前面的分别是: 0 Q5 o$ o3 b9 Q, _( c
$ r, E" s! h* I. }: E! t s
Word Freq
- t3 P3 P; r2 C* }3 k1 1485 4 j \3 u' o" M9 p( X
2 东风 1382 ; W, m6 Z; N N
3 何处 1230 1 I- R) |6 C8 R6 ?; t, Q9 |
4 人间 1202 ) d8 D g# c. O4 Z* |$ `" p7 X0 _: P0 }
5 风流 857 2 R+ Y5 e/ `4 z6 O( O& K* P
6 归去 812
: p$ J; z8 U: i) x3 B# k& V7 春风 802 - d4 f, L* Q! B
8 西风 779
5 t' {/ l# A1 u0 W% ]" z0 u9 归来 771
3 \- c: u2 ]' c6 R3 k# z& _4 ]; Q+ a4 k$ a+ [10 江南 765
5 H1 C) o: l& ?- X3 u11 相思 753
3 d G8 |) }6 w2 Y: V- {% N& b, Z12 梅花 732
3 j1 m& _: z2 A* s8 ~# I13 千里 676 6 M# f( h+ v% M+ S
14 回首 656 ; p$ `6 g8 ^6 _3 s+ F9 C" ~
15 明月 651 / ^3 W+ @. A% e8 m
16 多少 648 8 F6 @4 F9 o0 |4 F# M
17 如今 642
) I, F& C/ C, f1 X18 阑干 630 % h1 J4 i( i6 ~
19 年年 613
- r" y1 p- @* u9 ]( |2 F v20 万里 590
2 |: q2 c7 [8 o: S- W21 一笑 582
6 N* a7 Q, u. }; R: u: S+ {* w& y9 F& @22 黄昏 550
# p3 S! g e+ j$ G5 t23 当年 542 3 e( b! v/ F# e8 ~2 D8 `
24 天涯 537
; N: r9 W6 ?) g0 M$ {% O25 相逢 528
) r5 ^9 Y- R: P! }4 _- R26 芳草 527
' E) \. q- N( f: n27 尊前 516 ' h+ J$ ~9 h' M2 N' w" l
28 一枝 512
+ G" B, a2 I5 f( v4 w29 风雨 505
1 n4 m) f# ]. D6 N/ p; M" x4 I30 流水 472 . |% _' U8 _! o( e4 \9 v7 i2 w; J' r7 f
31 依旧 472
$ s- Q; f) j- G5 Q* b32 风吹 471 " L7 n( e3 x+ a0 q! P
33 风月 461
0 m& Z- Z4 o2 u3 X34 多情 457 6 y+ J. H& K) P" I& a. U
35 故人 451 7 `: _, L$ G- t* ^! d6 \# O/ h m
36 当时 450 ; N5 V$ c: Z, G% }! i- \; W
37 无人 445 9 F; f3 ?( n" }0 J
38 斜阳 438 . N! y! c) ~/ s/ H; [, W
39 不知 430
+ _9 X5 w) a& ?1 C# M( P0 Q40 不见 429 0 R8 M8 h. L l/ s6 E4 N
41 深处 422
* O) S0 Z% [) @) S3 n6 L42 时节 403 # Q, {0 x- u6 | f: }; [
43 平生 398 ' W" U- d" K- k1 k( _: D
44 凄凉 398 : U& R, T: B0 J6 B7 j
45 春色 394
$ e' Y4 D1 i ^: P" d- z' G! e3 ~46 匆匆 383
% |4 V- b" G' b47 功名 383
6 r" Z6 Y. }- b" U9 |( f48 一点 378
. |6 t6 _0 E" j) S* u6 a8 M49 无限 377 + c. L. X' p H" x
50 今日 369 9 W: }6 R9 J/ |/ K* T. R: F. _
51 天上 368
* X8 ]- r$ O; v+ \* Q52 杨柳 362 ; n- [" i% K* I5 {% Y3 H
53 西湖 356
0 U! z4 j3 y/ p/ T9 v0 c54 桃花 354 / B# Q0 v0 j' W
55 扁舟 353 9 J7 A" |, }9 T7 z
56 消息 351 . z' \- R" Y, c, @9 K
57 憔悴 344
. l1 e2 D6 K7 d# q q9 @58 何事 339 ( T! r# f. z g$ \' Z2 p8 [
59 芙蓉 338 4 Z* K2 U. b, s7 X
60 神仙 334
1 ?3 a X; ~1 E3 |- x5 i61 一片 334
4 \' F1 d, l3 w/ d" V: U c2 \62 桃李 333 0 Z: g! n) M) u/ r/ ?2 r2 j
63 人生 332
. s/ G1 I* F; {" `: Q# v64 十分 331 6 G! ?, _+ l5 r8 H
65 心事 329
. k$ N" K- h7 @' k0 ^66 黄花 328 . Q* A ^- H; |! S3 Y% Y5 t% P
67 一声 325
8 X1 o/ q/ k2 H9 Q& l68 佳人 324 " n* S& [7 \6 S- p
69 长安 321
3 B& {- q+ u; e70 东君 319 $ L% V- i( @, \; o* z
71 断肠 316 `/ ~/ {: U: n8 t. K' i1 P- P
72 而今 315 * N x+ D2 x x3 ]4 W' y
73 鸳鸯 314
# R5 X' P8 Q' ~3 s6 g74 为谁 313
/ H" F K3 l: V J; ^75 十年 310 / c2 U5 B! i/ }0 |% i( S. r
76 去年 309 & T9 g" C$ r$ v
77 少年 308 - r4 K1 p' R/ X9 `& l% d5 n
78 海棠 307 , Y/ X; }, M8 X( o8 I8 k
79 寂寞 306 + [, T8 _% \6 U3 a
80 无情 306
4 P$ G7 j c! y# U81 不是 305 % Z6 o% M2 J4 ]9 X6 A- `2 X
82 时候 304 " ~+ T- ^! g4 ]2 @
83 肠断 303
* _$ r% k& S6 W% W D( j0 M5 p84 富贵 303
0 u* p3 q9 x, a85 蓬莱 303
) B1 r- z/ ~% B! q( I86 昨夜 303
) O/ K! t/ l3 ~! Q, C87 行人 302
" e7 I) _0 p7 y8 T1 X3 l88 今夜 301 ; S, u; P1 g5 p' d7 n- N
89 谁知 300 ! q( `) r: ?( D- i/ u
90 不似 299
0 ]) x( I5 y. i91 江上 298
. I% ~/ k" ^6 [' A5 }8 C8 |1 [92 悠悠 296
' W5 W! f% ^* ]9 d' u8 R/ A93 几度 295
8 m$ B. `5 C! @94 青山 295
# C, D2 _* t: p+ _0 }! m95 何时 294 ; J+ h& O/ e+ U+ f X& {
96 天气 293 , |. ]! v7 M. w4 w- k4 ?# K
97 惟有 293
/ i" g8 C0 M& ?2 f98 一曲 291 : l8 P$ c! P( a( V" J' v' D( I& g
99 月明 291 / U* E1 V' n ?. s
100 往事 290 ; d8 h4 f. h/ e# d9 Y0 a- O* {% e
7 W+ _5 }& Y# D
至于为什么第一名是数字,他解释:“排在第一的是无效字符,这跟数据源有关。” 8 v { {% p4 t; [( b
n7 m; J3 [4 K1 D
这个结果一出来,一位网友就一语道破了“玄机”,“原来,最流行的宋词就是‘东风何处在人间’啊!” % N. Q5 R, l; g; T6 h
/ H0 W. H2 Q2 W' e% u生日、手机号 随意组合都很美 5 [! S9 K2 Y6 }4 S
1 z) [* V$ H) B6 ^( |- l" S
还有更绝的呢!署名为“达芬奇的鸡蛋”的果壳网友不知怎么地,就想到了拿大家都会背一点的圆周率进行创作,两个数字一断,对照高频词表,一首“华丽丽”的词就出来了!还附上了说明,特别像模像样。 k6 A. B3 F& [: m; L% p
7 g* W2 V8 j. ^1 |! B
+ z7 M) c) t- ]6 S+ F( B2 e: a玩法示例: " A' p" R/ b8 y0 M$ [- K0 w! u3 O
--------------------------------------------------------------------------------------------------------------------------------------------
/ d( u) l1 s) M1 U* ~* u9 j * A- n- I* E5 L5 o
达芬奇的鸡蛋 @ 果壳
; X* A" j3 M6 u7 K7 `2 W
r' v& o4 h ~) d" S Q: s清平乐·圆周率 7 [( r- Y {2 x1 D. V. p P
`+ I2 t2 j i" `( P回首明月(一看就是抒情诗) $ b; m' |3 i `$ a- c( m1 p6 x
14 15
. V1 L6 i1 C) K! n悠悠心事空(果然,貌似失恋了) ; ~; S$ ]3 T% }' N1 `
92 65
# G) y# a( {2 C西湖何事寂寞中(触景生情)
: p8 m; H3 a, m% H0 J" v35 89 79
2 N+ }) U r6 M1 L# Z6 y" _风吹斜阳匆匆(回忆那天下午的艳遇) 0 P5 s) y: L. c) J A! x
32 38 46 z Z5 j7 b% F6 p M
C+ h* g6 C+ K
芳草平生斜阳(平生见过最美的太阳和芳草,都是因为那里有你的身影) " U1 {( p4 O. a) J6 ]* E
26 43 38
k3 T' L( d @+ s" I风吹寂寞今日(到现在就剩我自己) - {/ i+ ~4 w3 K+ I
32 79 50
7 ~2 F9 G7 m! `+ g一枝富贵年年(好花美丽年年开,好景宜人不常在) ) n& P& R& ^9 I7 L+ `+ V* M2 v' ^
28 84 19
/ B4 D' t1 `" a/ l+ M' [7 I断肠长安不知(我的思念远方的你可知道?)
' J$ @! I& s+ `- _# O% }71 69 39 . N8 P( u G6 t- Z+ ^' `0 n
7 d0 m+ ]( @1 t9 \4 L如梦令·根号二 1 n+ t& R# X2 j+ c5 y
% k: z9 K% Z) g7 s1 {
深处时节千里(过了许多年,男猪脚来到了很遥远的地方) * R. j( N1 z5 |* [. J9 W
41 42 13 4 X5 R* O$ [1 B* s; J% D$ @
消息当年鸳鸯(这。。找老相好去了?)
9 }3 E5 @* t% p( K7 E7 M56 23 73
, Q9 b# Q* l9 f& x9 k% w) u* o5 d( t: z归来今日(妹子,我胡汉三回来啦)
, b4 z4 j3 P3 z2 ]09 50
& l6 O6 ^0 x E0 a3 a4 o一点无情多少(你还知道来看我啊!) ) i! a5 i+ o. t L1 A' ?' R
48 80 16 ( i5 M) G* {) v4 l3 c X& M. Z4 T
今夜,今夜(要出问题了。。。)
5 I# @% O6 M; p1 c88 88 ! e2 d+ S2 j: p3 f1 t! b# X# u% f
而今时节归来(仿佛重回当年,男猪脚依然那么坚挺)
/ |# Z& z- A# |' l. m" C72 42 09 ( `, a( U* H* \7 o5 }! N$ P
7 N5 K0 s0 f1 n7 d% ~' h% s; \
! }) G6 L7 K( D" l- |0 w6 v/ j
网友评论部分
" s& @2 i; C/ h6 v. c' H----------------------------------------------------------------------------------------------------------------------------------------------
, X( p8 A+ ?$ c' O D% `2 N% i. m
: G) J3 Q* ]1 W$ G看完这首诗,网友们一边膜拜,一边自己的创作灵感也被打开了。
* I1 U# {1 b L2 i5 p/ L. l+ j# v/ ]2 q" @7 P
“丘寒”留言道:“试着用某个号码创作了一首:天上相思,芳草年年,昨夜江南,回首一笑多情。”
% F; S, B' G( ]6 C& h1 x“零Ronnie”很有创作激情:“我的生日:年年江上,江南春风;我的手机号:明月芳草去年,江南阑干归去……还真挺上口的!我也能做诗人了哈哈!”
1 B6 Z8 I4 `+ R' T7 K( I; g9 l$ T- w, W
理科生欢呼:消灭文科生的日子来了
% V6 c: u* a7 q% Q: U, ~: G
" \( a$ e. Y# V/ ]! N. C可是这么一来,文科生又不淡定了,一群文科生跳起来反击。
4 w( L% E, R4 x1 o" T8 T8 s6 J1 r
“雯名霞迩”大叫:“统统拖出去,斩了!这让学中文的人情何以堪啊!”
! k& V+ Y" r+ `; x' A% m“Rockfish”代表理科生还击:“理科宅男们消灭文科生的日子到来了!拿起你的计算器,消灭文艺青年吧!”
# j$ Y/ t% X4 t1 w1 N/ k% u% F“可可”童鞋呼唤:“就让科技小清新来得更猛烈些吧!”
. j3 y" k* U) }1 y2 z: g4 }# N
* E9 z: r" @0 e w9 b d& S' Z还有一群网友七嘴八舌讨论着。 - j* U+ P2 u; q, r
' W/ I, W# j' Q
“沌世界”淡定地说:“不知宋词的粉丝看了是不是有一种偶像破灭的感觉。” 9 ^: I% c- b# w! Y/ g* V( U( f/ h
“家杰仕”童鞋也总结道:“文艺男女已经阻止不了技术宅作诗了!”
9 x1 ]0 }' D) k: N& C* v/ Z P& F网友“Rakin”点评:“理科生文艺得真凶猛!” 9 c- l8 ^- [* Z) M0 k
“焰心Spring”呼吁:“想文艺一回的同学请转!” 6 G) J0 B% { @7 m1 l3 ~3 X. @. {
“ChanIm”表示:“当时学写诗的时候超鄙视这些,现在淡定了,因为没那么多愁善感了。” 9 C& N& D6 r3 A
“思念的秋天”感慨:“穿越必备!”
. W" r6 E% N) `, o5 ^“NetCharm”说:“背熟了,随便组合一下,写出来的也不会太烂。” w( Y+ J9 s% |% N& t8 [8 W7 w
“huahualipo”童鞋还提出了意见:“高人,能不能把平仄也加上……如果平仄太困难,至少考虑一下词尾押韵如何?韵脚也就十来个,每个都分配一个数值,然后每隔一行,末尾的词就只从一个值下选。这样会大大增加仿真度啊!”! f/ c/ M2 e. O
2 Q; b" Z3 h0 U' }6 g
再次神经短路,突然想看看宋词里面什么样的意象是最常见的,比如可以做个频率分析什么的。当然文本挖掘需要分词,我没法在其中花太多时间,于是想出了一个土办法。宋词的句子都很短,如果穷举可能的字的组合的话并不是太多,况且最常见的词语一般是两三个字,这样可能的组合就更少了。比如“犹解嫁东风”这句话,可能的二字组合是“犹解”“解嫁”“嫁东”“东风”,三字组合是“犹解嫁”“解嫁东”“嫁东风”,词的字数越多,可能的组合就越少。如果把每句话可能的字的组合都列举出来,就可以整体统计频率了。4 j1 _( m; ?0 b1 K7 x: |
8 Y5 s. U$ ^' A/ [1 {6 w2 H I) v
9 R% F) h( y% n" N9 B' Z- p2 q7 F) N P1 _, A
当然里面会有很多无意义的字的组合,不过这类“词语”本身的出现就是一个偶然,所以可以预期的是它们整体的频数会很低,是入不了“大雅之堂”的。话不多说,直接上代码和结果。
0 M/ O( m) H! T, ]0 Y8 N f! l
' H3 r. t3 h, q/ B1 Z. h3 T& T
. j, J2 v4 }# |2 Q+ v/ q内容很多参照自:http://blog.renren.c​om/blog/326678730/78​5811432 + g9 B8 n5 _( e
* ?& U2 x/ }( B2 q% k$ c
7 | C2 l3 v6 J- c# S咩哈哈哈哈哈~~理科万岁
+ }8 s, o& B0 i. H- Y+ |8 A; Z: _! K0 m7 a
* ~: f" b; R6 @1 ? |
|