当前位置: 首页 > news >正文

python字符级差异分析并生成 Word 报告 自然语言处理断句

 

import difflib
from docx import Document
from docx.shared import RGBColor
from snownlp import SnowNLPdef analyze_char_differences(text_a, text_b):"""分析两个文本的字符级差异:param text_a: 第一个文本:param text_b: 第二个文本"""matcher = difflib.SequenceMatcher(None, text_a, text_b)print("差异分析(字符级):")for tag, i1, i2, j1, j2 in matcher.get_opcodes():if tag == 'replace':print(f"替换:位置 {i1}-{i2} 从 '{''.join(text_a[i1:i2])}' 变为 '{''.join(text_b[j1:j2])}'")elif tag == 'insert':print(f"插入:位置 {i1} 插入 '{''.join(text_b[j1:j2])}'")elif tag == 'delete':print(f"删除:位置 {i1}-{i2} 删除 '{''.join(text_a[i1:i2])}'")def generate_word_diff_report(text_a, text_b, output_file="diff.docx"):"""生成 Word 格式的字符级差异报告:param text_a: 第一个文本:param text_b: 第二个文本:param output_file: 输出的 Word 文件名"""matcher = difflib.SequenceMatcher(None, text_a, text_b)doc = Document()doc.add_heading('字符级差异报告', level=1)paragraph = doc.add_paragraph()for tag, i1, i2, j1, j2 in matcher.get_opcodes():if tag == 'equal':# 相同部分,正常颜色run = paragraph.add_run(text_a[i1:i2])elif tag == 'replace':# 替换部分,删除的用红色,新增的用绿色run = paragraph.add_run(text_a[i1:i2])run.font.color.rgb = RGBColor(255, 0, 0)run = paragraph.add_run(text_b[j1:j2])run.font.color.rgb = RGBColor(0, 128, 0)elif tag == 'insert':# 插入部分,用绿色run = paragraph.add_run(text_b[j1:j2])run.font.color.rgb = RGBColor(0, 128, 0)elif tag == 'delete':# 删除部分,用红色run = paragraph.add_run(text_a[i1:i2])run.font.color.rgb = RGBColor(255, 0, 0)doc.save(output_file)return output_filedef sentence_segmentation_with_color_preservation(input_file, output_file="segmented_diff.docx"):doc = Document(input_file)new_doc = Document()new_doc.add_heading('断句后的字符级差异报告', level=1)for paragraph in doc.paragraphs:new_paragraph = new_doc.add_paragraph()for run in paragraph.runs:text = run.texts = SnowNLP(text)sentences = s.sentencesfor i, sentence in enumerate(sentences):new_run = new_paragraph.add_run(sentence)new_run.font.color.rgb = run.font.color.rgbif i < len(sentences) - 1:new_paragraph.add_run('。')# 在每个句子后添加换行符new_paragraph.add_run('\n')new_doc.save(output_file)if __name__ == "__main__":# 这里可以根据实际情况替换为具体的文本内容t = ''.join([char for char in t if char.isprintable()])t1 = ''.join([char for char in t1 if char.isprintable()])# 字符级差异分析text_a = list(t)text_b = list(t1)analyze_char_differences(text_a, text_b)# 字符级差异分析并生成 Word 报告diff_file = generate_word_diff_report(t, t1)# 对生成的 Word 报告进行断句并保留颜色信息sentence_segmentation_with_color_preservation(diff_file)
# -*- coding: utf-8 -*-
t = """西游记第一回 灵根育孕源流出 心性修持大道生灵根育孕源流出 心性修持大道生诗曰:混沌未分天地乱,茫茫渺渺无人见。自从盘古破鸿蒙,开辟从兹清浊辨。覆载群生仰至仁,发明万物皆成善。欲知造化会元功,须看西游释厄传。盖闻天地之数,有十二万九千六百岁为一元。将一元分为十二会,乃子、丑、寅、卯、辰、巳、午、未、申、酉、戌、亥之十二支也。每会该一万八百岁。且就一日而论:子时得阳气,而丑则鸡鸣;寅不通光,而卯则日出;辰时食后,而巳则挨排;日午天中,而未则西蹉;申时晡而日落酉;戌黄昏而人定亥。譬于大数,若到戌会之终,则天地昏蒙而万物否矣。再去五千四百岁,交亥会之初,则当黑暗,而两间人物俱无矣,故曰混沌。又五千四百岁,亥会将终,贞下起元,近子之会,而复逐渐开明。邵康节曰:“冬至子之半,天心无改移。一阳初动处,万物未生时。”到此,天始有根。再五千四百岁,正当子会,轻清上腾,有日,有月,有星,有辰。日、月、星、辰,谓之四象。故曰,天开于子。又经五千四百岁,子会将终,近丑之会,而逐渐坚实。易曰:“大哉乾元!至哉坤元!万物资生,乃顺承天。”至此,地始凝结。再五千四百岁,正当丑会,重浊下凝,有水,有火,有山,有石,有土。水、火、山、石、土谓之五形。故曰,地辟于丑。又经五千四百岁,丑会终而寅会之初,发生万物。历曰:“天气下降,地气上升;天地交合,群物皆生。”至此,天清地爽,阴阳交合。再五千四百岁,正当寅会,生人,生兽,生禽,正谓天地人,三才定位。故曰,人生于寅。感盘古开辟,三皇治世,五帝定轮,世界之间,遂分为四大部洲:曰东胜神洲,曰西牛贺洲,曰南赡部洲,曰北俱芦洲。这部书单表东胜神洲。海外有一国土,名曰傲来国。国近大海,海中有一座山,唤为花果山。此山乃十洲之祖脉,三岛之来龙,自开清浊而立,鸿蒙判后而成。真个好山!有词赋为证。赋曰:势镇汪洋,威宁瑶海。势镇汪洋,潮涌银山鱼入袕;威宁瑶海,波翻雪浪蜃离渊。木火方隅高积上,东海之处耸崇巅。丹崖怪石,削壁奇峰。丹崖上,彩凤双鸣;削壁前,麒麟独卧。峰头时听锦鸡鸣,石窟每观龙出入。林中有寿鹿仙狐,树上有灵禽玄鹤。瑶草奇花不谢,青松翠柏长春。仙桃常结果,修竹每留云。一条涧壑藤萝密,四面原堤草色新。正是百川会处擎天柱,万劫无移大地根。那座山,正当顶上,有一块仙石。其石有三丈六尺五寸高,有二丈四尺围圆。三丈六尺五寸高,按周天三百六十五度;二丈四尺围圆,按政历二十四气。上有九窍八孔,按九宫八卦。四面更无树木遮阴,左右倒有芝兰相衬。盖自开辟以来,每受天真地秀,日精月华,感之既久,遂有灵通之意。内育仙胞,一日迸裂,产一石卵,似圆球样大。因见风,化作一个石猴,五官俱备,四肢皆全。便就学爬学走,拜了四方。目运两道金光,射冲斗府。惊动高天上圣大慈仁者玉皇大天尊玄穹高上帝,驾座金阙云宫灵霄宝殿,聚集仙卿,见有金光焰焰,即命千里眼、顺风耳开南天门观看。二将果奉旨出门外,看的真,听的明。须臾回报道:“臣奉旨观听金光之处,乃东胜神洲海东傲来小国之界,有一座花果山,山上有一仙石,石产一卵,见风化一石猴,在那里拜四方,眼运金光,射冲斗府。如今服饵水食,金光将潜息矣。”玉帝垂赐恩慈曰:“下方之物,乃天地精华所生,不足为异。”那猴在山中,却会行走跳跃,食草木,饮涧泉,采山花,觅树果;与狼虫为伴,虎豹为群,獐鹿为友,猕猿为亲;夜宿石崖之下,朝游峰洞之中。真是“山中无甲子,寒尽不知年。”一朝天气炎热,与群猴避暑,都在松阴之下顽耍。你看他一个个:跳树攀枝,采花觅果;抛弹子,-么儿;跑沙窝,砌宝塔;赶蜻蜓,扑八蜡;参老天,拜菩萨;扯葛藤,编草-;捉虱子,咬又掐;理毛衣,剔指甲;挨的挨,擦的擦;推的推,压的压;扯的扯,拉的拉,青松林下任他顽,绿水涧边随洗濯。一群猴子耍了一会,却去那山涧中洗澡。见那股涧水奔流,真个似滚瓜涌溅。古云:“禽有禽言,兽有兽语。”众猴都道:“这股水不知是那里的水。我们今日赶闲无事,顺涧边往上溜头寻看源流,耍子去耶!”喊一声,都拖男挈女,呼弟呼兄,一齐跑来,顺涧爬山,直至源流之处,乃是一股瀑布飞泉。但见那:一派白虹起,千寻雪浪飞;海风吹不断,江月照还依。冷气分青嶂,馀流润翠微;潺-名瀑布,真似挂帘帷。众猴拍手称扬道:“好水!好水!原来此处远通山脚之下,直接大海之波。”又道:“那一个有本事的,钻进去寻个源头出来,不伤身体者,我等即拜他为王。”连呼了三声,忽见丛杂中跳出一名石猴,应声高叫道:“我进去!我进去!”好猴!也是他:今日芳名显,时来大运通;有缘居此地,王遣入仙宫。你看他瞑目蹲身,将身一纵,径跳入瀑布泉中,忽睁睛抬头观看,那里边却无水无波,明明朗朗的一架桥梁。他住了身,定了神,仔细再看,原来是座铁板桥。桥下之水,冲贯于石窍之间,倒挂流出去,遮闭了桥门。却又欠身上桥头,再走再看,却似有人家住处一般,真个好所在。但见那:翠藓堆蓝,白云浮玉,光摇片片烟霞。虚窗静室,滑凳板生花。侞窟龙珠倚挂,萦回满地奇葩。锅灶傍崖存火迹,樽-靠案见肴渣。石座石床真可爱,石盆石碗更堪夸。又见那一竿两竿修竹,三点五点梅花。几树青松常带雨,浑然相个人家。看罢多时,跳过桥中间,左右观看,只见正当中有一石碣。碣上有一行楷书大字,镌着“花果山福地,水帘洞洞天。”石猴喜不自胜,急怞身往外便走,复瞑目蹲身,跳出水外,打了两个呵呵道:“大造化!大造化!”众猴把他围住,问道:“里面怎么样?水有多深?”石猴道:“没水!没水!原来是一座铁板桥。桥那边是一座天造地设的家当。”众猴道:“怎见得是个家当?”石猴笑道:“这股水乃是桥下冲贯石桥,倒挂下来遮闭门户的。桥边有花有树,乃是一座石房。房内有石窝、石灶、石碗、石盆、石床、石凳。中间一块石碣上,镌着‘花果山福地,水帘洞洞天。’真个是我们安身之处。里面且是宽阔,容得千百口老小。我们都进去住也,省得受老天之气。这里边:刮风有处躲,下雨好存身。霜雪全无惧,雷声永不闻。烟霞常照耀,祥瑞每蒸熏。松竹年年秀,奇花日日新。”众猴听得,个个欢喜,都道:“你还先走,带我们进去,进去!”石猴却又瞑目蹲身,往里一跳,叫道:“都随我进来!进来!”那些猴有胆大的,都跳进去了;胆小的,一个个伸头缩颈,抓耳挠腮,大声叫喊,缠一会,也都进去了。跳过桥头,一个个抢盆夺碗,占灶争床,搬过来,移过去,正是猴性顽劣,再无一个宁时,只搬得力倦神疲方止。石猿端坐上面道:“列位呵,‘人而无信,不知其可。’你们才说有本事进得来,出得去,不伤身体者,就拜他为王。我如今进来又出去,出去又进来,寻了这一个洞天与列位安眠稳睡,各享成家之福,何不拜我为王?”众猴听说,即拱伏无违。一个个序齿排班,朝上礼拜,都称“千岁大王”。自此,石猴高登王位,将“石”字儿隐了,遂称美猴王。有诗为证。诗曰:三阳交泰产群生,仙石胞含日月精。借卵化猴完大道,假他名姓配丹成。内观不识因无相,外合明知作有形。历代人人皆属此,称王称圣任纵横。美猴王领一群猿猴、猕猴、马猴等,分派了君臣佐使,朝游花果山,暮宿水帘洞,合契同情,不入飞鸟之丛,不从走兽之类,独自为王,不胜欢乐。是以:春采百花为饮食,夏寻诸果作生涯。秋收芋栗延时节,冬觅黄精度岁华。美猴王享乐天真,何期有三五百载。一日,与群猴喜宴之间,忽然忧恼,堕下泪来。众猴慌忙罗拜道:“大王何为烦恼?”猴王道:“我虽在欢喜之时,却有一点儿远虑,故此烦恼。”众猴又笑道:“大王好不知足!我等日日欢会,在仙山福地,古洞神州,不伏麒麟辖,不伏凤凰管,又不伏人间王位所拘束,自由自在,乃无量之福,为何远虑而忧也?”猴王道:“今日虽不归人王法律,不惧禽兽威服,将来年老血衰,暗中有阎王老子管着,一旦身亡,可不枉生世界之中,不得久住天人之内?”众猴闻此言,一个个掩面悲啼,俱以无常为虑。只见那班部中,忽跳出一个通背猿猴,厉声高叫道:“大王若是这般远虑,真所谓道心开发也!如今五虫之内,惟有三等名色,不伏阎王老子所管。”猴王道:“你知那三等人?”猿猴道:“乃是佛与仙与神圣三者,躲过轮回,不生不灭,与天地山川齐寿。”猴王道:“此三者居于何所?”猿猴道:“他只在阎浮世界之中,古洞仙山之内。”猴王闻之,满心欢喜,道:“我明日就辞汝等下山,云游海角,远涉天涯,务必访此三者,学一个不老长生,常躲过阎君之难。”噫!这句话,顿教跳出轮回网,致使齐天大圣成。众猴鼓掌称扬,都道:“善哉!善哉!我等明日越岭登山,广寻些果品,大设筵宴送大王也。”次日,众猴果去采仙桃,摘异果,刨山药,□【左“属”右“立刀”】黄精,芝兰香蕙,瑶草奇花,般般件件,整整齐齐,摆开石凳石桌,排列仙酒仙肴。但见那:金丸珠弹,红绽黄肥。金丸珠弹腊樱桃,色真甘美;红绽黄肥熟梅子,味果香酸。鲜龙眼,肉甜皮薄;火荔枝,核小囊红。林檎碧实连枝献,枇杷缃苞带叶擎。兔头梨子鸡心枣,消渴除烦更解酲。香桃烂杏,美甘甘似玉液琼浆;脆李杨梅,酸荫荫如脂酸膏酪。红囊黑子熟西瓜,四瓣黄皮大柿子。石榴裂破,丹砂粒现火晶珠;芋栗剖开,坚硬肉团金玛瑙。胡桃银杏可传茶,椰子葡萄能做酒。榛松榧柰满盘盛,橘蔗柑橙盈案摆。熟煨山药,烂煮黄精,捣碎茯苓并薏苡,石锅微火漫炊羹。人间纵有珍馐味,怎比山猴乐更宁?群猴尊美猴王上坐,各依齿肩排于下边,一个个轮流上前,奉酒,奉花,奉果,痛饮了一日。次日,美猴王早起,教:“小的们,替我折些枯松,编作筏子,取个竹竿作篙,收拾些果品之类,我将去也。”果独自登筏,尽力撑开,飘飘荡荡,径向大海波中,趁天风,来渡南赡部洲地界。这一去,正是那:天产仙猴道行隆,离山驾筏趁天风。飘洋过海寻仙道,立志潜心建大功。有分有缘休俗愿,无忧无虑会元龙。料应必遇知音者,说破源流万法通。也是他运至时来,自登木筏之后,连日东南风紧,将他送到西北岸前,乃是南赡部洲地界。持篙试水,偶得浅水,弃了筏子,跳上岸来,只见海边有人捕鱼、打雁、挖蛤、淘盐。他走近前,弄个把戏,妆个□【上左“齿”右“可”,下“女”】虎,吓得那些人丢筐弃网,四散奔跑。将那跑不动的拿住一个,剥了他衣裳,也学人穿在身上,摇摇摆摆,穿州过府,在市尘中,学人礼,学人话。朝餐夜宿,一心里访问佛仙神圣之道,觅个长生不老之方。见世人都是为名为利之徒,更无一个为身命者。正是那:争名夺利几时休?早起迟眠不自由!骑着驴骡思骏马,官居宰相望王侯。只愁衣食耽劳碌,何怕阎君就取勾?继子荫孙图富贵,更无一个肯回头!猴王参访仙道,无缘得遇。在于南赡部洲,串长城,游小县,不觉八九年馀。忽行至西洋大海,他想着海外必有神仙。独自个依前作筏,又飘过西海,直至西牛贺洲地界。登岸偏访多时,忽见一座高山秀丽,林麓幽深。他也不怕狼虫,不惧虎豹,登山顶上观看。果是好山:千峰开戟,万仞开屏。日映岚光轻锁翠,雨收黛色冷含青。枯藤缠老树,古渡界幽程。奇花瑞草,修竹乔松。修竹乔松,万载常青欺福地;奇花瑞草,四时不谢赛蓬瀛。幽鸟啼声近,源泉响溜清。重重谷壑芝兰绕,处处-崖苔藓生。起伏峦头龙脉好,必有高人隐姓名。正观看间,忽闻得林深之处,有人言语,急忙趋步,穿入林中,侧耳而听,原来是歌唱之声。歌曰:“观棋柯烂,伐木丁丁,云边谷口徐行,卖薪沽酒,狂笑自陶情。苍迳秋高,对月枕松根,一觉天明。认旧林,登崖过岭,持斧断枯藤。收来成一担,行歌市上,易米三升。更无些子争竞,时价平平,不会机谋巧算,没荣辱,恬淡延生。相逢处,非仙即道,静坐讲黄庭。”美猴王听得此言,满心欢喜道:“神仙原来藏在这里!”急忙跳入里面,仔细再看,乃是一个樵子,在那里举斧砍柴。但看他打扮非常:头上戴箬笠,乃是新笋初脱之箨。身上穿布衣,乃是木绵捻就之纱。腰间系环绦,乃是老蚕口吐之丝。足下踏草履,乃是枯莎搓就之爽。手执-钢斧,担挽火麻绳。扳松劈枯树,争似此樵能!猴王近前叫道:“老神仙!弟子起手。”那樵汉慌忙丢了斧,转身答礼道:“不当人!不当人!我拙汉衣食不全,怎敢当‘神仙’二字?”猴王道:“你不是神仙,如何说出神仙的话来?”樵夫道:“我说甚么神仙话?”猴王道:“我才来至林边,只听的你说:‘相逢处非仙即道,静坐讲黄庭。’黄庭乃道德真言,非神仙而何?”樵夫笑道:“实不瞒你说,这个词名做满庭芳,乃一神仙教我的。那神仙与我舍下相邻。他见我家事劳苦,日常烦恼,教我遇烦恼时,即把这词儿念念。一则散心,二则解困。我才有些不足处思虑,故此念念。不期被你听了。”猴王道:“你家既与神仙相邻,何不从他修行?学得个不老之方?却不是好?”樵夫道:“我一生命苦,自幼蒙父母养育至八九岁,才知人事,不幸父丧,母亲居孀。再无兄弟姊妹,只我一人,没奈何,早晚侍奉。如今母老,一发不敢抛离。却又田园荒芜,衣食不足,只得斫两束柴薪,挑向市尘之间,货几文钱,籴几升米,自炊自造,安排些茶饭,供养老母,所以不能修行。”猴王道:“据你说起来,乃是一个行孝的君子,向后必有好处。但望你指与我那神仙住处,却好拜访去也。”樵夫道:“不远,不远。此山叫做灵台方寸山。山中有座斜月三星洞。那洞中有一个神仙,称名须菩提祖师。那祖师出去的徒弟,也不计其数,见今还有三四十人从他修行。你顺那条小路儿,向南行七八里远近,即是他家了。”猴王用手扯住樵夫道:“老兄,你便同我去去。若还得了好处,决不忘你指引之恩。”樵夫道:“你这汉子,甚不通变。我方才这般与你说了,你还不省?假若我与你去了,却不误了我的生意?老母何人奉养?我要斫柴,你自去,自去。”猴王听说,只得相辞。出深林,找上路径,过一山坡,约有七八里远,果然望见一座洞府。挺身观看,真好去处!但见:烟霞散彩,日月摇光。千株老柏,万节修篁。千株老柏,带雨半空青冉冉;万节修篁,含烟一壑色苍苍。门外奇花布锦,桥边瑶草喷香。石崖突兀青苔润,悬壁高张翠藓长。时闻仙鹤唳,每见凤凰翔。仙鹤唳时,声振九皋霄汉远;凤凰翔起,翎毛五色彩云光。玄猿白鹿随隐见,金狮玉象任行藏。细观灵福地,真个赛天堂!又见那洞门紧闭,静悄悄杳无人迹。忽回头,见崖头立一石牌,约有三丈馀高、八尺馀阔,上有一行十个大字,乃是“灵台方寸山,斜月三星洞”。美猴王十分欢喜道:“此间人果是朴实。果有此山此洞。”看勾多时,不敢敲门。且去跳上松枝梢头,摘松子吃了顽耍。少顷间,只听得呀的一声,洞门开处,里面走出一个仙童,真个丰姿英伟,像貌清奇,比寻常俗子不同。但见他:-髻双丝绾,宽袍两袖风。貌和身自别,心与相俱空。物外长年客,山中永寿童。一尘全不染,甲子任翻腾。那童子出得门来,高叫道:“甚么人在此搔扰?”猴王扑的跳下树来,上前躬身道:“仙童,我是个访道学仙之弟子,更不敢在此搔扰。”仙童笑道:“你是个访道的么?”猴王道:“是。”童子道:“我家师父,正才下榻,登坛讲道。还未说出原由,就教我出来开门。说:‘外面有个修行的来了,可去接待接待。’想必就是你了?”猴王笑道:“是我,是我。”童子道:“你跟我进来。”这猴王整衣端肃,随童子径入洞天深处观看:一层层深阁琼楼,一进进珠宫贝阙,说不尽那静室幽居,直至瑶台之下。见那菩提祖师端坐在台上,两边有三十个小仙侍立台下。果然是:大觉金仙没垢姿,西方妙相祖菩提;不生不灭三三行,全气全神万万慈。空寂自然随变化,真如本性任为之;与天同寿庄严体,历劫明心大法师。美猴王一见,倒身下拜,磕头不计其数,口中只道:“师父!师父!我弟子志心朝礼!志心朝礼!”祖师道:“你是那方人氏?且说个乡贯姓名明白,再拜。”猴王道:“弟子东胜神洲傲来国花果山水帘洞人氏。”祖师喝令:“赶出去!他本是个撒诈捣虚之徒,那里修甚么道果!”猴王慌忙磕头不住道:“弟子是老实之言,决无虚诈。”祖师道:“你既老实,怎么说东胜神洲?那去处到我这里,隔两重大海,一座南赡部洲,如何就得到此?”猴王叩头道:“弟子飘洋过海,登界游方,有十数个年头,方才访到此处。”祖师道:“既是逐渐行来的也罢。你姓甚么?”猴王又道:“我无性。人若骂我,我也不恼;若打我,我也不嗔,只是陪个礼儿就罢了。一生无性。”祖师道:“不是这个性。你父母原来姓甚么?”猴王道:“我也无父母。”祖师道:“既无父母,想是树上生的?”猴王道:“我虽不是树生,却是石里长的。我只记得花果山上有一块仙石,其年石破,我便生也。”祖师闻言,暗喜道:“这等说,却是天地生成的。你起来走走我看。”猴王纵身跳起,拐呀拐的走了两遍。祖师笑道:“你身躯虽是鄙陋,却像个食松果的猢狲。我与你就身上取个姓氏,意思教你姓‘猢’。猢字去了个兽傍,乃是古月。古者,老也;月者,阴也。老阴不能化育,教你姓‘狲’倒好。狲字去了兽傍,乃是个子系。子者,儿男也;系者,婴细也。正合婴儿之本论。教你姓‘孙’罢。”猴王听说,满心欢喜,朝上叩头道:“好!好!好!今日方知姓也。万望师父慈悲!既然有姓,再乞赐个名字,却好呼唤。”祖师道:“我门中有十二个字,分派起名到你乃第十辈之小徒矣。”猴王道:“那十二个字?”祖师道:“乃广、大、智、慧、真、如、性、海、颖、悟、圆、觉十二字。排到你,正当‘悟’字。与你起个法名叫做‘孙悟空’好么?”猴王笑道:“好!好!好!自今就叫做孙悟空也!”正是:鸿蒙初辟原无姓,打破顽空须悟空。毕竟不之向后修些甚么道果,且听下回分解。
"""
t1 = """第一回 灵根育孕源流出 心性修持大道生
当前位置:
主页
西游记
诗曰:混沌未分天地乱,茫茫渺渺无人见。
自从盘古破鸿蒙,开辟从兹清浊辨。
覆载群生仰至仁,发明万物皆成善。
欲知造化会元功,须看《西游释厄传》。盖闻天地之数,有十二万九千六百岁为一元。将一元分为十二会,乃子、丑、寅、卯、辰、巳(sì)、午、未、申、酉、戌、亥之十二支也。每会该一万八百岁。且就一日而论:子时得阳气,而丑则鸡鸣;寅不通光,而卯则日出;辰时食后,而巳则挨排;日午天中,而未则西蹉;申时晡而日落酉;戌黄昏而人定亥。譬于大数,若到戌会之终,则天地昏蒙而万物否矣。再去五千四百岁,交亥会之初,则当黑暗,而两间人物俱无矣,故曰混沌。又五千四百岁,亥会将终,贞下起元,近子之会,而复逐渐开明。邵康节曰:“冬至子之半,天心无改移。一阳初动处,万物未生时。”到此,天始有根。再五千四百岁,正当子会,轻清上腾,有日,有月,有星,有辰。日、月、星、辰,谓之四象。故曰,天开于子。又经五千四百岁,子会将终,近丑之会,而逐渐坚实。易曰:“大哉乾元!至哉坤元!万物资生,乃顺承天。”至此,地始凝结。再五千四百岁,正当丑会,重浊下凝,有水,有火,有山,有石,有土。水、火、山、石、土谓之五形。故曰,地辟于丑。又经五千四百岁,丑会终而寅会之初,发生万物。历曰:“天气下降,地气上升;天地交合,群物皆生。”至此,天清地爽,阴阳交合。再五千四百岁,正当寅会,生人,生兽,生禽,正谓天地人,三才定位。故曰,人生于寅。感盘古开辟,三皇治世,五帝定伦,世界之间,遂分为四大部洲:曰东胜神洲,曰西牛贺洲,曰南赡部洲,曰北俱芦洲。这部书单表东胜神洲。海外有一国土,名曰傲来国。国近大海,海中有一座山,唤为花果山。此山乃十洲之祖脉,三岛之来龙,自开清浊而立,鸿蒙判后而成。真个好山!有词赋为证。赋曰:势镇汪洋,威宁瑶海。势镇汪洋,潮涌银山鱼入穴;威宁瑶海,波翻雪浪蜃(shèn)离渊。木火方隅高积上,东海之处耸崇巅。丹崖怪石,削壁奇峰。丹崖上,彩凤双鸣;削壁前,麒麟独卧。峰头时听锦鸡鸣,石窟每观龙出入。林中有寿鹿仙狐,树上有灵禽玄鹤。瑶草奇花不谢,青松翠柏长春。仙桃常结果,修竹每留云。一条涧壑藤萝密,四面原堤草色新。正是百川会处擎天柱,万劫无移大地根。那座山,正当顶上,有一块仙石。其石有三丈六尺五寸高,有二丈四尺围圆。三丈六尺五寸高,按周天三百六十五度;二丈四尺围圆,按政历二十四气。上有九窍八孔,按九宫八卦。四面更无树木遮阴,左右倒有芝兰相衬。盖自开辟以来,每受天真地秀,日精月华,感之既久,遂有灵通之意。内育仙胞,一日迸裂,产一石卵,似圆球样大。因见风,化作一个石猴,五官俱备,四肢皆全。便就学爬学走,拜了四方。目运两道金光,射冲斗府。惊动高天上圣大慈仁者玉皇大天尊玄穹高上帝,驾座金阙云宫灵霄宝殿,聚集仙卿,见有金光焰焰,即命千里眼、顺风耳开南天门观看。二将果奉旨出门外,看的真,听的明。须臾回报道:“臣奉旨观听金光之处,乃东胜神洲海东傲来小国之界,有一座花果山,山上有一仙石,石产一卵,见风化一石猴,在那里拜四方,眼运金光,射冲斗府。如今服饵水食,金光将潜息矣。”玉帝垂赐恩慈曰:“下方之物,乃天地精华所生,不足为异。”那猴在山中,却会行走跳跃,食草木,饮涧泉,采山花,觅树果;与狼虫为伴,虎豹为群,獐鹿为友,猕猿为亲;夜宿石崖之下,朝游峰洞之中。真是“山中无甲子,寒尽不知年。”一朝天气炎热,与群猴避暑,都在松阴之下顽耍。你看他一个个:跳树攀枝,采花觅果;抛弹子,邷么儿(以磨光的碎瓦片或小石子为玩具的儿童游戏。有些地方称为“抓子儿”。邷,wá)
;跑沙窝,砌宝塔;赶蜻蜓,扑  蜡;参老天,拜菩萨;扯葛藤,编草帓;捉虱子,咬又掐;理毛衣,剔指甲;挨的挨,擦的擦;推的推,压的压;扯的扯,拉的拉,青松林下任他顽,绿水涧边随洗濯(zhuó)。一群猴子耍了一会,却去那山涧中洗澡。见那股涧水奔流,真个似滚瓜涌溅。古云:“禽有禽言,兽有兽语。”众猴都道:“这股水不知是那里的水。我们今日赶闲无事,顺涧边往上溜头寻看源流,耍子去耶!”喊一声,都拖男挈女,呼弟呼兄,一齐跑来,顺涧爬山,直至源流之处,乃是一股瀑布飞泉。但见那:一派白虹起,千寻雪浪飞;海风吹不断,江月照还依。
冷气分青嶂,馀流润翠微;潺湲(chán yuán,水慢慢流动的样子)名瀑布,真似挂帘帷。众猴拍手称扬道:“好水!好水!原来此处远通山脚之下,直接大海之波。”又道:“那一个有本事的,钻进去寻个源头出来,不伤身体者,我等即拜他为王。”连呼了三声,忽见丛杂中跳出一名石猴,应声高叫道:“我进去!我进去!”好猴!也是他:今日芳名显,时来大运通;有缘居此地,王遣入仙宫。你看他瞑(míng)目蹲身,将身一纵,径跳入瀑布泉中,忽睁睛抬头观看,那里边却无水无波,明明朗朗的一架桥梁。他住了身,定了神,仔细再看,原来是座铁板桥。桥下之水,冲贯于石窍之间,倒挂流出去,遮闭了桥门。却又欠身上桥头,再走再看,却似有人家住处一般,真个好所在。但见那:翠藓堆蓝,白云浮玉,光摇片片烟霞。虚窗静室,滑凳板生花。乳窟龙珠倚挂,萦回满地奇葩。锅灶傍崖存火迹,樽罍(zūn
léi)靠案见肴渣。石座石床真可爱,石盆石碗更堪夸。又见那一竿两竿修竹,三点五点梅花。几树青松常带雨,浑然像个人家。看罢多时,跳过桥中间,左右观看,只见正当中有一石碣。碣上有一行楷书大字,镌着“花果山福地,水帘洞洞天。”石猴喜不自胜,急抽身往外便走,复瞑目蹲身,跳出水外,打了两个呵呵道:“大造化!大造化!”众猴把他围住,问道:“里面怎么样?水有多深?”石猴道:“没水!没水!原来是一座铁板桥。桥那边是一座天造地设的家当。”众猴道:“怎见得是个家当?”石猴笑道:“这股水乃是桥下冲贯石桥,倒挂下来遮闭门户的。桥边有花有树,乃是一座石房。房内有石窝、石灶、石碗、石盆、石床、石凳。中间一块石碣上,镌着‘花果山福地,水帘洞洞天。’真个是我们安身之处。里面且是宽阔,容得千百口老小。我们都进去住也,省得受老天之气。这里边:刮风有处躲,下雨好存身。霜雪全无惧,雷声永不闻。
烟霞常照耀,祥瑞每蒸熏。松竹年年秀,奇花日日新。”众猴听得,个个欢喜。都道:“你还先走,带我们进去,进去!”石猴却又瞑目蹲身,往里一跳,叫道:“都随我进来!进来!”那些猴有胆大的,都跳进去了;胆小的,一个个伸头缩颈,抓耳挠腮,大声叫喊,缠一会,也都进去了。跳过桥头,一个个抢盆夺碗,占灶争床,搬过来,移过去,正是猴性顽劣,再无一个宁时,只搬得力倦神疲方止。石猴端坐上面道:“列位呵,‘人而无信,不知其可’。你们才说有本事进得来,出得去,不伤身体者,就拜他为王。我如今进来又出去,出去又进来,寻了这一个洞天与列位安眠稳睡,各享成家之福,何不拜我为王?”众猴听说,即拱伏无违。一个个序齿(以年龄为顺序)排班,朝上礼拜,都称“千岁大王”。自此,石猴高登王位,将“石”字儿隐了,遂称美猴王。有诗为证,诗曰:三阳交泰产群生,仙石胞含日月精。
借卵化猴完大道,假他名姓配丹成。
内观不识因无相,外合明知作有形。
历代人人皆属此,称王称圣任纵横。美猴王领一群猿猴、猕猴、马猴等,分派了君臣佐使,朝游花果山,暮宿水帘洞,合契同情,不入飞鸟之丛,不从走兽之类,独自为王,不胜欢乐。是以:春采百花为饮食,夏寻诸果作生涯。
秋收芋栗延时节,冬觅黄精度岁华。美猴王享乐天真,何期有三五百载。一日,与群猴喜宴之间,忽然忧恼,堕下泪来。众猴慌忙罗拜道:“大王何为烦恼?”猴王道:“我虽在欢喜之时,却有一点儿远虑,故此烦恼。”众猴又笑道:“大王好不知足!我等日日欢会,在仙山福地,古洞神州,不伏麒麟辖,不伏凤凰管,又不伏人间王位所拘束,自由自在,乃无量之福,为何远虑而忧也?”猴王道:“今日虽不归人王法律,不惧禽兽威服,将来年老血衰,暗中有阎王老子管着,一旦身亡,可不枉生世界之中,不得久住天人之内?”众猴闻此言,一个个掩面悲啼,俱以无常为虑。只见那班部中,忽跳出一个通背猿猴,厉声高叫道:“大王若是这般远虑,真所谓道心开发也!如今五虫之内,惟有三等名色,不伏阎王老子所管。”猴王道:“你知那三等人?”猿猴道:“乃是佛与仙与神圣三者,躲过轮回,不生不灭,与天地山川齐寿。”猴王道:“此三者居于何所?”猿猴道:“他只在阎浮世界之中,古洞仙山之内。”猴王闻之,满心欢喜,道:“我明日就辞汝等下山,云游海角,远涉天涯,务必访此三者,学一个不老长生,常躲过阎君之难。”噫!这句话,顿教跳出轮回网,致使齐天大圣成。众猴鼓掌称扬,都道:“善哉!善哉!我等明日越岭登山,广寻些果品,大设筵宴送大王也。”次日,众猴果去采仙桃,摘异果,刨山药,劚黄精,芝兰香蕙,瑶草奇花,般般件件,整整齐齐,摆开石凳石桌,排列仙酒仙肴。但见那:金丸珠弹,红绽黄肥。金丸珠弹腊樱桃,色真甘美;红绽黄肥熟梅子,味果香酸。鲜龙眼,肉甜皮薄;火荔枝,核小囊红。林檎碧实连枝献,枇杷缃苞带叶擎。兔头梨子鸡心枣,消渴除烦更解酲(chéng)。香桃烂杏,美甘甘似玉液琼浆;脆李杨梅,酸荫荫如脂酥膏酪。红囊黑子熟西瓜,四瓣黄皮大柿子。石榴裂破,丹砂粒现火晶珠;芋栗剖开,坚硬肉团金玛瑙。胡桃银杏可传茶,椰子葡萄能做酒。榛松榧奈满盘盛,橘蔗柑橙盈案摆。熟煨山药,烂煮黄精。捣碎茯苓并薏苡(yì yǐ),石锅微火漫炊羹。人间纵有珍馐味,怎比山猴乐更宁?群猴尊美猴王上坐,各依齿肩排于下边,一个个轮流上前,奉酒,奉花,奉果,痛饮了一日。次日,美猴王早起,教:“小的们,替我折些枯松,编作筏子,取个竹竿作篙,收拾些果品之类,我将去也。”果独自登筏,尽力撑开,飘飘荡荡,径向大海波中,趁天风,来渡南赡部洲地界。这一去,正是那:天产仙猴道行隆,离山驾筏趁天风。
飘洋过海寻仙道,立志潜心建大功。
有分有缘休俗愿,无忧无虑会元龙。
料应必遇知音者,说破源流万法通。也是他运至时来,自登木筏之后,连日东南风紧,将他送到西北岸前,乃是南赡部洲地界。持篙试水,偶得浅水,弃了筏子,跳上岸来,只见海边有人捕鱼、打雁、挖蛤、淘盐。他走近前,弄个把戏,妆个【上左“齿”右“可”,下“女”】虎(做出一种吓人的怪样子)
,吓得那些人丢筐弃网,四散奔跑。将那跑不动的拿住一个,剥了他衣裳,也学人穿在身上,摇摇摆摆,穿州过府,在市廛(chán)中,学人礼,学人话。朝餐夜宿,一心里访问佛仙神圣之道,觅个长生不老之方。见世人都是为名为利之徒,更无一个为身命者。正是那:争名夺利几时休?早起迟眠不自由!
骑着驴骡思骏马,官居宰相望王侯。
只愁衣食耽劳碌,何怕阎君就取勾?
继子荫孙图富贵,更无一个肯回头!猴王参访仙道,无缘得遇。在于南赡部洲,串长城,游小县,不觉八九年余。忽行至西洋大海,他想着海外必有神仙。独自个依前作筏,又飘过西海,直至西牛贺洲地界。登岸遍访多时,忽见一座高山秀丽,林麓(lù)幽深。他也不怕狼虫,不惧虎豹,登山顶上观看。果是好山:千峰排戟,万仞开屏。日映岚光轻锁翠,雨收黛色冷含青。枯藤缠老树,古渡界幽程。奇花瑞草,修竹乔松。修竹乔松,万载常青欺福地;奇花瑞草,四时不谢赛蓬瀛(péng yíng,蓬莱山和瀛洲,相传为仙人所居之处。亦泛指仙境)。幽鸟啼声近,源泉响溜清。重重谷壑芝兰绕,处处巉(chán)崖苔藓生。起伏峦头龙脉好,必有高人隐姓名。正观看间,忽闻得林深之处,有人言语,急忙趋步,穿入林中,侧耳而听,原来是歌唱之声。歌曰:“观棋柯烂,伐木丁丁,云边谷口徐行,卖薪沽酒,狂笑自陶情。苍迳秋高,对月枕松根,一觉天明。认旧林,登崖过岭,持斧断枯藤。“观棋柯烂,伐木丁丁,云边谷口徐行。卖薪沽酒(买酒。沽,gū),狂笑自陶情。苍径秋高对月,枕松根,一觉天明。认旧林,登崖过岭,持斧断枯藤。收来成一担,行歌市上,易米三升。更无些子争竞,时价平平。不会机谋巧算,没荣辱,恬淡延生。相逢处,非仙即道,静坐讲《黄庭》。”美猴王听得此言,满心欢喜道:“神仙原来藏在这里!”急忙跳入里面,仔细再看,乃是一个樵子,在那里举斧砍柴。但看他打扮非常:头上戴箬笠(ruò lì,用箬竹叶及篾编成的宽边帽),乃是新笋初脱之箨(tuò)。身上穿布衣,乃是木绵拈就之纱。腰间系环绦,乃是老蚕口吐之丝。足下踏草履(lǚ),乃是枯莎槎就之爽。手执衠钢斧,担挽火麻绳。扳松劈枯树,争似此樵能猴王近前叫道:“老神仙!弟子起手。”那樵汉慌忙丢了斧,转身答礼道:“不当人!不当人!我拙汉衣食不全,怎敢当‘神仙’二字?”猴王道:“你不是神仙,如何说出神仙的话来?”樵夫道:“我说什么神仙话?”猴王道:“我才来至林边,只听的你说:‘相逢处,非仙即道,静坐讲《黄庭》。’《黄庭》乃道德真言,非神仙而何?”樵夫笑道:“实不瞒你说,这个词名做《满庭芳》,乃一神仙教我的。那神仙与我舍下相邻。他见我家事劳苦,日常烦恼,教我遇烦恼时,即把这词儿念念,一则散心,二则解困。我才有些不足处思虑,故此念念。不期被你听了。”猴王道:“你家既与神仙相邻,何不从他修行?学得个不老之方,却不是好?”樵夫道:“我一生命苦:自幼蒙父母养育至八九岁,才知人事,不幸父丧,母亲居孀(shuāng)。再无兄弟姊妹,只我一人,没奈何,早晚侍奉。如今母老,一发不敢抛离。却又田园荒芜,衣食不足,只得斫(zhuó)两束柴薪,挑向市廛之间,货几文钱,籴几升米,自炊自造,安排些茶饭,供养老母,所以不能修行。”猴王道:“据你说起来,乃是一个行孝的君子,向后必有好处。但望你指与我那神仙住处,却好拜访去也。”樵夫道:“不远,不远。此山叫做灵台方寸山。山中有座斜月三星洞。那洞中有一个神仙,称名须菩提祖师。那祖师出去的徒弟,也不计其数,见今还有三四十人从他修行。你顺那条小路儿,向南行七八里远近,即是他家了。”猴王用手扯住樵夫道:“老兄,你便同我去去。若还得了好处,决不忘你指引之恩。”樵夫道:“你这汉子,甚不通变。我方才这般与你说了,你还不省?假若我与你去了,却不误了我的生意?老母何人奉养?我要斫柴,你自去,自去!”猴王听说,只得相辞。出深林,找上路径,过一山坡,约有七八里远,果然望见一座洞府。挺身观看,真好去处!但见:烟霞散彩,日月摇光。千株老柏,万节修篁(修竹,长竹子。篁,huáng)。千株老柏,带雨半空青冉冉;万节修篁,含烟一壑色苍苍。门外奇花布锦,桥边瑶草喷香。石崖突兀青苔润,悬壁高张翠藓长。时闻仙鹤唳(lì),每见凤凰翔。仙鹤唳时,声振九皋霄汉远;凤凰翔起,翎毛五色彩云光。玄猿白鹿随隐见,金狮玉象任行藏。细观灵福地,真个赛天堂!又见那洞门紧闭,静悄悄杳无人迹。忽回头,见崖头立一石碑,约有三丈余高,八尺余阔,上有一行十个大字,乃是“灵台方寸山,斜月三星洞”。美猴王十分欢喜道:“此间人果是朴实。果有此山此洞。”看勾多时,不敢敲门。且去跳上松枝梢头,摘松子吃了顽耍。少顷间,只听得呀的一声,洞门开处,里面走出一个仙童,真个丰姿英伟,像貌清奇,比寻常俗子不同。但见他:髽髻(即抓髻)双丝绾,宽袍两袖风。貌和身自别,心与相俱空。
物外长年客,山中永寿童。一尘全不染,甲子任翻腾。那童子出得门来,高叫道:“甚么人在此搔扰?”猴王扑的跳下树来,上前躬身道:“仙童,我是个访道学仙之弟子,更不敢在此搔扰。”仙童笑道:“你是个访道的么?”猴王道:“是。”童子道:“我家师父,正才下榻,登坛讲道。还未说出原由,就教我出来开门。说:‘外面有个修行的来了,可去接待接待。’想必就是你了?”猴王笑道:“是我,是我。”童子道:“你跟我进来。”这猴王整衣端肃,随童子径入洞天深处观看:一层层深阁琼楼,一进进珠宫贝阙,说不尽那静室幽居,直至瑶台之下。见那菩提祖师端坐在台上,两边有三十个小仙侍立台下。果然是:大觉金仙没垢姿,西方妙相祖菩提;
不生不灭三三行,全气全神万万慈。
空寂自然随变化,真如本性任为之;
与天同寿庄严体,历劫明心大法师。美猴王一见,倒身下拜,磕头不计其数,口中只道:“师父!师父!我弟子志心朝礼!志心朝礼!”祖师道:“你是那方人氏?且说个乡贯姓名明白,再拜。”猴王道:“弟子东胜神洲傲来国花果山水帘洞人氏。”祖师喝令:“赶出去!他本是个撒诈捣虚之徒,那里修甚么道果!”猴王慌忙磕头不住道:“弟子是老实之言,决无虚诈。”祖师道:“你既老实,怎么说东胜神洲?那去处到我这里,隔两重大海,一座南赡部洲,如何就得到此?”猴王叩头道:“弟子飘洋过海,登界游方,有十数个年头,方才访到此处。”祖师道:“既是逐渐行来的也罢。你姓甚么?”猴王又道:“我无性。人若骂我,我也不恼;若打我,我也不嗔,只是陪个礼儿就罢了。一生无性。”祖师道:“不是这个性。你父母原来姓甚么?”猴王道:“我也无父母。”祖师道:“既无父母,想是树上生的?”猴王道:“我虽不是树生,却是石里长的。我只记得花果山上有一块仙石,其年石破,我便生也。”祖师闻言,暗喜道:“这等说,却是天地生成的。你起来走走我看。”猴王纵身跳起,拐呀拐的走了两遍。祖师笑道:“你身躯虽是鄙陋,却像个食松果的猢狲。我与你就身上取个姓氏,意思教你姓‘猢’。猢字去了个兽傍,乃是古月。古者,老也;月者,阴也。老阴不能化育,教你姓‘狲’倒好。狲字去了兽傍,乃是个子系。子者,儿男也;系者,婴细也。正合婴儿之本论。教你姓‘孙’罢。”猴王听说,满心欢喜,朝上叩头道:“好!好!好!今日方知姓也。万望师父慈悲!既然有姓,再乞赐个名字,却好呼唤。”祖师道:“我门中有十二个字,分派起名到你乃第十辈之小徒矣。”猴王道:“那十二个字?”祖师道:“乃广、大、智、慧、真、如、性、海、颖、悟、圆、觉十二字。排到你,正当‘悟’字。与你起个法名叫做‘孙悟空’好么?”猴王笑道:“好!好!好!自今就叫做孙悟空也!”正是:鸿蒙初辟原无姓,打破顽空须悟空。毕竟不之向后修些甚么道果,且听下回分解。"""import difflib
from docx import Document
from docx.shared import RGBColor
from snownlp import SnowNLPdef analyze_char_differences(text_a, text_b):"""分析两个文本的字符级差异:param text_a: 第一个文本:param text_b: 第二个文本"""matcher = difflib.SequenceMatcher(None, text_a, text_b)print("差异分析(字符级):")for tag, i1, i2, j1, j2 in matcher.get_opcodes():if tag == 'replace':print(f"替换:位置 {i1}-{i2} 从 '{''.join(text_a[i1:i2])}' 变为 '{''.join(text_b[j1:j2])}'")elif tag == 'insert':print(f"插入:位置 {i1} 插入 '{''.join(text_b[j1:j2])}'")elif tag == 'delete':print(f"删除:位置 {i1}-{i2} 删除 '{''.join(text_a[i1:i2])}'")def generate_word_diff_report(text_a, text_b, output_file="diff.docx"):"""生成 Word 格式的字符级差异报告:param text_a: 第一个文本:param text_b: 第二个文本:param output_file: 输出的 Word 文件名"""matcher = difflib.SequenceMatcher(None, text_a, text_b)doc = Document()doc.add_heading('字符级差异报告', level=1)paragraph = doc.add_paragraph()for tag, i1, i2, j1, j2 in matcher.get_opcodes():if tag == 'equal':# 相同部分,正常颜色run = paragraph.add_run(text_a[i1:i2])elif tag == 'replace':# 替换部分,删除的用红色,新增的用绿色run = paragraph.add_run(text_a[i1:i2])run.font.color.rgb = RGBColor(255, 0, 0)run = paragraph.add_run(text_b[j1:j2])run.font.color.rgb = RGBColor(0, 128, 0)elif tag == 'insert':# 插入部分,用绿色run = paragraph.add_run(text_b[j1:j2])run.font.color.rgb = RGBColor(0, 128, 0)elif tag == 'delete':# 删除部分,用红色run = paragraph.add_run(text_a[i1:i2])run.font.color.rgb = RGBColor(255, 0, 0)doc.save(output_file)return output_filedef sentence_segmentation_with_color_preservation(input_file, output_file="segmented_diff.docx"):doc = Document(input_file)new_doc = Document()new_doc.add_heading('断句后的字符级差异报告', level=1)for paragraph in doc.paragraphs:new_paragraph = new_doc.add_paragraph()for run in paragraph.runs:text = run.texts = SnowNLP(text)sentences = s.sentencesfor i, sentence in enumerate(sentences):new_run = new_paragraph.add_run(sentence)new_run.font.color.rgb = run.font.color.rgbif i < len(sentences) - 1:new_paragraph.add_run('。')# 在每个句子后添加换行符new_paragraph.add_run('\n')new_doc.save(output_file)if __name__ == "__main__":# 这里可以根据实际情况替换为具体的文本内容t = ''.join([char for char in t if char.isprintable()])t1 = ''.join([char for char in t1 if char.isprintable()])# 字符级差异分析text_a = list(t)text_b = list(t1)analyze_char_differences(text_a, text_b)# 字符级差异分析并生成 Word 报告diff_file = generate_word_diff_report(t, t1)# 对生成的 Word 报告进行断句并保留颜色信息sentence_segmentation_with_color_preservation(diff_file)

相关文章:

python字符级差异分析并生成 Word 报告 自然语言处理断句

import difflib from docx import Document from docx.shared import RGBColor from snownlp import SnowNLPdef analyze_char_differences(text_a, text_b):"""分析两个文本的字符级差异:param text_a: 第一个文本:param text_b: 第二个文本"""…...

企业级云MES全套源码,支持app、小程序、H5、台后管理端

企业级云MES全套源码&#xff0c;支持app、小程序、H5、台后管理端&#xff0c;全套源码 开发环境 技术架构&#xff1a;springboot vue-element-plus-admin 开发语言&#xff1a;Java 开发工具&#xff1a;idea 前端框架&#xff1a;vue.js 后端框架&#xff…...

使用GoldenGate完成SQLserver到Oracle的数据实时同步

一、环境准备 *项目**源环境**目标环境*操作系统CentOS Linux release 7.6CentOS Linux release 7.6IP地址192.168.3.92192.168.3.168数据库及版本SQLserver 2016Oracle 11.2.0.4.0GoldenGate用户oggoggGoldenGate版本12.3.0.2.012.3.0.2.0 二、OGG架构 GoldenGate v11 能够…...

【OpenCV C++】如何快速 高效的计算出图像中大于值的像素个数? 遍历比较吗? No,效率太低!那么如何更高效?

文章目录 1 问题2 分析3 代码实现 (两种方法实现)方法1: 使用cv::compare方法2: 使用cv::threshold3.2 compare和threshold 看起来都有二值化效果? 那么二者效率?4 compare函数解释4.1 参数解释4.2 底层行为规则4.3 应用示例4.4 典型应用场景1 问题 一幅图像的目标区域ROI…...

Golang | 每日一练 (6)

&#x1f4a2;欢迎来到张胤尘的技术站 &#x1f4a5;技术如江河&#xff0c;汇聚众志成。代码似星辰&#xff0c;照亮行征程。开源精神长&#xff0c;传承永不忘。携手共前行&#xff0c;未来更辉煌&#x1f4a5; 文章目录 Golang | 每日一练 (6)题目参考答案什么是内存逃逸&am…...

git clone, 算是解决可以访问github但无法clone的问题

本文的前提是使用了**且可以正常访问github 查看代理的端口 将其配置到git 首先查看git配置 git config --list然后添加配置&#xff0c;我这边使用的是Hiddfy默认的端口是12334&#xff0c;如果是clash应该是7890 git config --global http.proxy 127.0.0.1:12334其他 删除…...

SpringBoot项目controller层接收对应格式请求的相关RequestMapping配置

目录 &#xff08;1&#xff09; &#xff08;2&#xff09; &#xff08;3&#xff09; 注&#xff1a;此情况注意和&#xff08;4&#xff09;中情况进行区分 &#xff08;4&#xff09; 在几个springboot项目开发后&#xff0c;我总结了以下的一些常见的接收对应请求的…...

基于ssm学科竞赛小程序的设计及实现(源码+lw+部署文档+讲解),源码可白嫖!

摘要 随着信息时代的来临&#xff0c;过去的学科竞赛管理方式的缺点逐渐暴露&#xff0c;本次对过去的学科竞赛管理方式的缺点进行分析&#xff0c;采取计算机方式构建学科竞赛小程序。本文通过阅读相关文献&#xff0c;研究国内外相关技术&#xff0c;提出了一种关于竞赛信息…...

【论文笔记】VGGT-从2D感知3D:pose估计+稠密重建+点跟踪

VGG组联合Meta改进了dust3r&#xff0c;输入图片&#xff0c;输出对应的一系列3D属性&#xff0c;被CVPR2025收录&#xff01; 1.abstract 我们提出了VGGT&#xff0c;一种前馈神经网络&#xff0c;能够直接从场景的一个、几个或数百个视角推断出所有关键的3D属性&#xff0c;…...

【大模型系列篇】硅基智能开源数字人模型HeyGem.ai,开启数字人时刻

硅基智能开源数字人模型HeyGem.ai, 1秒克隆生成4K视频, 支持离线多语言, 开源72小时狂揽1.3k星, 目前已经获得3.4k星。 硅基智能正式宣布在GitHub开源全球TOP级数字人模型&#xff0c;同时发布基于该模型的同名数字人工具硅基数字人克隆的本地安装包&#xff0c;这一举措标志着…...

腾讯云容器集群:节点可以访问公网,节点内的pod无法访问公网

腾讯云容器集群&#xff1a;节点可以访问公网&#xff0c;节点内的pod无法访问公网 curl https://www.baidu.com/index.htm参考链接&#xff1a;https://cloud.tencent.com/document/product/457/50356 sysctl -a|grep net.ipv4.conf.all.rp_filter sysctl -a|grep net.ipv4.c…...

Winform优化控件布局性能 SuspendLayout 和 ResumeLayout 方法详解

在Winform中&#xff0c;SuspendLayout 和 ResumeLayout 方法用于优化控件布局性能&#xff0c;适用于批量修改控件属性或动态调整控件时的场景。以下是具体使用方法和注意事项&#xff1a; 一、基本用法‌ 1‌.调用 SuspendLayout()‌ 在开始批量修改控件前&#xff0c;调用…...

基于Netty实现高性能HTTP服务的架构解析

一、HTTP协议基础 1.1 HTTP协议概述 HTTP&#xff08;HyperText Transfer Protocol&#xff09;作为现代Web应用的基石&#xff0c;是基于TCP/IP的应用层协议&#xff0c;具有以下核心特性&#xff1a; 请求/响应模型&#xff1a;客户端发起请求&#xff0c;服务端返回响应无…...

Sqlite下载、安装与数据库创建

Sqlite官网 https://www.sqlite.org/index.html 官方文档链接 https://www.sqlite.org/docs.html 官方文档是英文版的&#xff0c;如果想看中文的文档请参考 **菜鸟教程** 网站中的 **《Sqlite教程》&#xff1a;https://www.runoob.com/sqlite/sqlite-tutorial.html 官方下载…...

内网环境安装dlv,本地远程调试go

背景&#xff1a;内网环境(服务器)下安装dlv,本地通过dlv调试编译后的go代码。 可以配合观看: 【dlv远程调试-哔哩哔哩】 https://b23.tv/NqPZ5q9 内网安装dlv步骤 1、dlv安装: &#xff08;我额服务器和内网的go都是1.21以上&#xff09; # 先在有网络的环境下&#xff08…...

【使用 Element UI 实现手动上传文件:FormData 追加文件和其他参数,支持单文件覆盖上传】

在开发 Web 应用时&#xff0c;文件上传是一个常见的需求。Element UI 提供了强大的 el-upload 组件&#xff0c;可以轻松实现文件上传功能。本文将详细介绍如何使用 Element UI 实现以下功能&#xff1a; 手动触发文件上传&#xff1a;用户选择文件后&#xff0c;点击按钮手动…...

python基础8 单元测试

通过前面的7个章节&#xff0c;作者学习了python的各项基础知识&#xff0c;也学习了python的编译和执行。但在实际环境上&#xff0c;我们需要验证我们的代码功能符合我们的设计预期&#xff0c;所以需要结合python的单元测试类&#xff0c;编写单元测试代码。 Python有一个内…...

第四节:sqlx库使用指南

在项目中我们通常可能会使用database/sql连接MySQL数据库。本文借助使用sqlx实现批量插入数据的例子&#xff0c;介绍了sqlx中可能被你忽视了的sqlx.In和DB.NamedExec方法。 sqlx介绍 在项目中我们通常可能会使用database/sql连接MySQL数据库。sqlx可以认为是Go语言内置datab…...

麒麟操作系统作为服务器,并且需要在浏览器上调试 MATLAB

在内网环境下&#xff0c;使用麒麟操作系统作为服务器&#xff0c;并且需要在浏览器上调试 MATLAB 程序&#xff0c;这确实复杂&#xff0c;但仍然有可行的解决方案。麒麟操作系统是国产化的 Linux 发行版&#xff08;如基于 Ubuntu Kylin 或银河麒麟&#xff09;&#xff0c;因…...

在线教育网站项目第四步:deepseek骗我, WSL2不能创建两个独立的Ubuntu,但我们能实现实例互访及外部访问

一、说明 上一章折腾了半天&#xff0c;搞出不少问题&#xff0c;今天我们在deepseek的帮助下&#xff0c;完成多个独立ubuntu24.04实例的安装&#xff0c;并完成固定ip&#xff0c;实践证明&#xff0c;deepseek不靠谱&#xff0c;浪费我2个小时时间&#xff0c;我们将在下面实…...

AI安全、大模型安全研究(DeepSeek)

DeepSeek 点燃AI应用革命之火,但安全 “灰犀牛” 正在逼近 DeepSeek-R1国产大模型的发布,以技术创新惊艳了全球,更是极致的性价比推动国内千行百业接入 AI,政府、企业竞速开发智能业务处理、智能客服、代码生成、营销文案等应用,“落地效率” 成为第一关键词。然而与此相…...

(hash表+vector 数位和相等数对的最大和)leetcode 2342

一定要断点调试看看数据对不对的上&#xff01;&#xff01;&#xff01;不然很容易弄不清楚值和下标 这个题意思是在nums中找出相同数位和的值 如 数位和为7 nums中符合要求的有 43&#xff0c;7 在这些数中选两个相加取最大值&#xff0c;再与其他数位和取得的相加最大值比…...

正则表达式引擎深入探讨

正则表达式引擎&#xff08;Regular Expression Engine&#xff09;是正则表达式得以“活起来”的核心。它是一个精密的软件组件&#xff0c;负责接收正则表达式和输入文本&#xff0c;解析模式并执行匹配或替换操作&#xff0c;最终输出结果——可能是简单的“是否匹配”&…...

[蓝桥杯 2023 省 B] 飞机降落(不会dfs的看过来)

[蓝桥杯 2023 省 B] 飞机降落 题目描述 N N N 架飞机准备降落到某个只有一条跑道的机场。其中第 i i i 架飞机在 T i T_{i} Ti​ 时刻到达机场上空&#xff0c;到达时它的剩余油料还可以继续盘旋 D i D_{i} Di​ 个单位时间&#xff0c;即它最早可以于 T i T_{i} Ti​ 时刻…...

DockerTLS加密/不加密传输

前言&#xff1a; 在Docker容器的网络通信中&#xff0c;安全性是至关重要的。DockerTLS作为一种加密传输协议&#xff0c;通过为Docker守护进程与客户端之间的通信提供加密层&#xff0c;有效防止数据在传输过程中被窃取或篡改。然而&#xff0c;在某些特定场景下&#xff0c;…...

基于微信小程序的充电桩管理系统

一、开发背景 在开发充电汽车管理系统之前&#xff0c;深入的需求分析至关重要。我们要充分了解不同用户群体的需求&#xff0c;比如私家车主希望充电过程便捷、高效、安全&#xff0c;能够实时查看充电状态和费用明细&#xff1b;出租车、网约车司机则更注重充电速度和充电桩…...

Excel导出工具类--复杂的excel功能导出(使用自定义注解导出)

Excel导出工具类 前言: 简单的excel导出,可以用easy-excel, fast-excel, auto-poi,在导出实体类上加上对应的注解,用封装好的工具类直接导出,但对于复杂的场景, 封装的工具类解决不了,要用原生的excel导出(easy-excel, fast-excel, auto-poi都支持原生的) 业务场景: 根据…...

创新实训项目初始化——gitee的使用

创新实训项目管理采用gitee&#xff0c;写下这篇博客熟悉gitee进行项目创建和版本同步 一、gitee概述 Gitee 是一个基于 Git 的代码托管平台&#xff0c;与 GitHub 类似&#xff0c;Gitee 提供了丰富的功能&#xff0c;比如代码仓库的创建、分支管理、代码审查等。 二、gite…...

【原创】使用ElasticSearch存储向量实现大模型RAG

一、概述 检索增强生成&#xff08;Retrieval-Augmented Generation&#xff0c;RAG&#xff09;已成为大型语言模型&#xff08;LLM&#xff09;应用的重要架构&#xff0c;通过结合外部知识库来增强模型的回答能力&#xff0c;特别是在处理专业领域知识、最新信息或企业私有数…...

Gymnasium Cart Pole 环境与 REINFORCE 算法 —— 强化学习入门 2

Title: Gymnasium Cart Pole 环境与 REINFORCE 算法 —— 强化学习入门 2 文章目录 I. Gymnasium Cart Pole 环境II. REINFORCE 算法1. 原理说明2. REINFORCE 算法实现 I. Gymnasium Cart Pole 环境 Gymnasium Cart Pole 环境是一个倒立摆的动力学仿真环境. 状态空间: 0: Ca…...

响应式数据 和 Pinia 状态

响应式数据 和 Pinia 状态 是 Vue.js 应用中用于管理数据的两种重要机制&#xff0c;它们之间有密切的关系。以下是它们的定义、特点以及关系&#xff1a; 1. 响应式数据 定义 响应式数据 是 Vue.js 的核心特性之一&#xff0c;指的是当数据发生变化时&#xff0c;视图会自动…...

在大数据开发中hive是指什么?

hello宝子们...我们是艾斯视觉擅长ui设计和前端数字孪生、大数据、三维建模、三维动画10年经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩! 在大数据技术的浩瀚星空中&#xff0c;Apache Hive犹如一座桥梁&#xff0c;连接着传统数据仓库理念…...

LeRobot源码剖析——对机器人各个动作策略的统一封装:包含ALOHA ACT、Diffusion Policy、VLA模型π0

前言 过去2年多的深入超过此前7年&#xff0c;全靠夜以继日的勤奋&#xff0c;一天当两天用&#xff0c;抠论文 抠代码 和大模型及具身同事讨论&#xff0c;是目前日常 而具身库里&#xff0c;idp3、π0、lerobot值得反复研究&#xff0c;故&#xff0c;近期我一直在抠π0及l…...

Python生成requirements.txt的两种方法

Python生成requirements.txt的两种方法 方法一&#xff1a;导出当前环境的依赖包 使用pipreqs --encodingutf8为使用utf8编码&#xff0c;避免编码报错 --force 强制执行覆盖生成目录下的requirements.txt # 安装 python3 -m pip install pipreqs # 在当前目录生成 pipreqs . …...

如何判断 MSF 的 Payload 是 Staged 还是 Stageless(含 Meterpreter 与普通 Shell 对比)

在渗透测试领域&#xff0c;Metasploit Framework&#xff08;MSF&#xff09;的 msfvenom 工具是生成 Payload&#xff08;载荷&#xff09;的核心利器。然而&#xff0c;当我们选择 Payload 时&#xff0c;经常会遇到一个问题&#xff1a;这个 Payload 是 Staged&#xff08;…...

HTML5与CSS3新特性详解

一、HTML5新特性 1.概述 HTML5 的新增特性主要是针对于以前的不足&#xff0c;增加了一些新的标签、新的表单和新的表单属性等。 这些新特性都有兼容性问题&#xff0c;基本是 IE9 以上版本的浏览器才支持&#xff0c;如果不考虑兼容性问题&#xff0c;可以大量使用这些新特…...

Redis常用进阶 存储原理和主从思路

Redis常用进阶 存储原理和主从思路 简介 此篇用于需要时随时查阅的知识. 由于不断的学习总是会忘记一些 所以用于记录 笔记对应视频为黑马redis https://www.bilibili.com/video/BV1Pu411Y7bq 单点redis的问题 : 数据丢失问题 持久化并发能力弱 主从集群存储能力问题 ES故…...

本地部署DeepSeek-R1(Dify升级最新版本、新增插件功能、过滤推理思考过程)

下载最新版本Dify Dify1.0版本之前不支持插件功能&#xff0c;先升级DIfy 下载最新版本&#xff0c;目前1.0.1 Git地址&#xff1a;https://github.com/langgenius/dify/releases/tag/1.0.1 我这里下载到老版本同一个目录并解压 拷贝老数据 需先停用老版本Dify PS D:\D…...

分治-快速排序系列一>快速排序

目录 题目方法&#xff1a;优化方法&#xff1a;代码&#xff1a; 题目方法&#xff1a; 忘记快速排序看这里&#xff1a;链接: link 优化方法&#xff1a; 代码&#xff1a; public int[] sortArray(int[] nums) {qsort(nums,0,nums.length-1);return nums;}private void qso…...

【spring对bean Singleton和Prototype的管理流程】

在 Spring 框架中&#xff0c;Bean 的作用域决定了 Bean 的生命周期和创建方式。Spring 支持多种作用域&#xff0c;其中最常用的是 单例&#xff08;Singleton&#xff09; 和 原型&#xff08;Prototype&#xff09;。以下是 Spring 对单例和原型 Bean 的管理流程详解&#x…...

【Java】grpc-java在IDEA中build不成功的相关问题,Android,codegen C++语言排除

一、解决Android依赖问题 在当前grpc-java项目根目录下创建gradle.properties文件,输入以下内容: skipAndroid=true或者 android.useAndroidX=true二、com.google.cloud.tools.appengine插件找不到的问题 Plugin [id: ‘com.google.cloud.tools.appengine’, version: ‘…...

十七、实战开发 uni-app x 项目(仿京东)- 后端指南

前面我们已经用uniappx进行了前端实战学习 一、实战 开发uni-app x项目(仿京东)-规划-CSDN博客 二、实战 开发uni-app x项目(仿京东)-项目搭建-CSDN博客 三、实战开发 uni-app x 项目(仿京东)- 技术选型-CSDN博客 四、实战开发 uni-app x 项目(仿京东)- 页面设计-C…...

SpringSecurity——基于角色权限控制和资源权限控制

目录 基于角色权限控制 1.1 自定义 UserDetailsService 1.2 加载用户角色 1.3. 给角色配置能访问的资源&#xff08;使用切面拦截&#xff0c;使用注解&#xff09; 总结 资源权限控制 2.2. 需要有一个用户&#xff1b;&#xff08;从数据库查询用户&#xff09; 2.2 基…...

经历过的IDEA+Maven+JDK一些困惑

注意事项&#xff1a;由于使用过程中是IDEA绑定好另外2个工具&#xff0c;所以报错统一都显示在控制台&#xff0c;但要思考和分辨到底是IDEA本身问题导致的报错&#xff0c;还是maven导致的 标准配置 maven Java Compiler Structure 编辑期 定义&#xff1a;指的是从open pr…...

基于Arduino控制的温室蔬菜园环境监控系统(论文+源码)

2.1系统总体方案设计 本课题为基于Arduino控制的温室蔬菜园环境监控系统&#xff0c;在硬件上结合Arduino 控制器&#xff0c;土壤湿度传感器&#xff0c;ESP8266模块&#xff0c;环境温湿度传感器&#xff0c;光敏电阻&#xff0c;液晶等来构成整个系统&#xff0c;其可以实现…...

关于HAL库的知识1----MSP函数

在 HAL 库中&#xff0c;大部分外设在初始化时都会调用一个对应的 MSP 初始化函数&#xff0c;这个函数的主要作用就是配置与外设相关的底层硬件资源&#xff0c;比如时钟、GPIO、中断、DMA 等。常见的外设及其对应的 MSP 函数包括&#xff1a; UART/USART&#xff1a;对应 HA…...

QT 磁盘文件 教程04-创建目录、删除目录、遍历目录

【1】新建目录 bool CreateDir(QString name){QString fileName name ;QDir dir(fileName);if (dir.isEmpty()) {dir.mkdir(fileName);return true;}else{qDebug()<<"文件夹已存在";return false;} } 【2】删除目录 bool DeleteDir(QString fileName){if (…...

高级java每日一道面试题-2025年3月06日-微服务篇[Eureka篇]-Eureka Server和Eureka Client关系?

如果有遗漏,评论区告诉我进行补充 面试官: Eureka Server和Eureka Client关系? 我回答: 在微服务架构中&#xff0c;Eureka作为Netflix开源的服务发现组件&#xff0c;由Eureka Server&#xff08;服务端&#xff09;和Eureka Client&#xff08;客户端&#xff09;两大部分…...

MAC-在使用@Async注解的方法时,分布式锁管理和释放

在使用 @Async 注解的异步方法中管理分布式锁时,需要特别注意 ​锁的获取、释放与异步执行的生命周期匹配。以下是结合 Spring Boot 和 Redis 分布式锁的实践方案: 1. 为什么需要分布式锁? 异步方法可能被多个线程/服务实例并发执行,若访问共享资源(如数据库、缓存),需…...

Kafka 八股文

一、基础概念 1. Kafka 是什么&#xff1f;它的核心组件有哪些&#xff1f; Kafka 的定义 Kafka 是一个 分布式流处理平台&#xff0c;最初由 LinkedIn 开发&#xff0c;后成为 Apache 顶级项目。它主要用于 高吞吐量的实时数据流处理&#xff0c;支持发布-订阅模式的消息传递…...