敏感点_草庐IT

.NET 6 实现敏感词过滤

一、什么是敏感词过滤？敏感词过滤是一种处理网络内容的技术，可以检测和过滤出网络中的敏感/违禁词汇。它通过给定的关键字或字符串，判断网络内容是否包含某些敏感信息，从而防止违反法律法规的信息流通。通常，可以使用两种方法来过滤敏感词：黑名单过滤：即定义一个黑名单，将所有敏感词择记录在其中，然后对输入的文本进行对比，如果发现有敏感词，就将其过滤掉。白名单过滤：即定义一个白名单，将所有不敏感的词汇记录在其中，然后对输入的文本进行对比，如果发现有不在白名单中的词汇，就将其过滤掉。二、ToolGood.Words是什么？ToolGood.Words是一款高性能非法词(敏感词)检测组件，附带繁体简体互换，支持

NET 实现 string resCode resultStr .NET技术

.NET 6 实现敏感词过滤

一、什么是敏感词过滤？敏感词过滤是一种处理网络内容的技术，可以检测和过滤出网络中的敏感/违禁词汇。它通过给定的关键字或字符串，判断网络内容是否包含某些敏感信息，从而防止违反法律法规的信息流通。通常，可以使用两种方法来过滤敏感词：黑名单过滤：即定义一个黑名单，将所有敏感词择记录在其中，然后对输入的文本进行对比，如果发现有敏感词，就将其过滤掉。白名单过滤：即定义一个白名单，将所有不敏感的词汇记录在其中，然后对输入的文本进行对比，如果发现有不在白名单中的词汇，就将其过滤掉。二、ToolGood.Words是什么？ToolGood.Words是一款高性能非法词(敏感词)检测组件，附带繁体简体互换，支持

NET 实现 string resCode resultStr .NET技术

KeePass敏感信息明文传输漏洞复现（CVE-2023-24055）

一、漏洞描述漏洞简述KeePass是一款免费的开源密码管理器，可帮助您以安全的方式管理您的密码。您可以将所有密码存储在一个数据库中，该数据库由一把万能钥匙锁定。因此，您只需记住一个主密钥即可解锁整个数据库。数据库文件使用目前已知的最佳和最安全的加密算法（AES-256、ChaCha20和Twofish）进行加密。对KeePass配置文件具有写入权限的攻击者可以修改它并注入恶意触发器，例如通过添加导出触发器来获取明文密码。漏洞影响范围供应商：KeePass产品：KeePassPasswordSafe2确认受影响版本：KeePass2.53版本修复版本：KeePass2.53.1版本二、漏洞复现实

KeePass 24055 Parameter strong 网络安全

KeePass敏感信息明文传输漏洞复现（CVE-2023-24055）

一、漏洞描述漏洞简述KeePass是一款免费的开源密码管理器，可帮助您以安全的方式管理您的密码。您可以将所有密码存储在一个数据库中，该数据库由一把万能钥匙锁定。因此，您只需记住一个主密钥即可解锁整个数据库。数据库文件使用目前已知的最佳和最安全的加密算法（AES-256、ChaCha20和Twofish）进行加密。对KeePass配置文件具有写入权限的攻击者可以修改它并注入恶意触发器，例如通过添加导出触发器来获取明文密码。漏洞影响范围供应商：KeePass产品：KeePassPasswordSafe2确认受影响版本：KeePass2.53版本修复版本：KeePass2.53.1版本二、漏洞复现实

KeePass 24055 Parameter strong 网络安全

局部敏感哈希-向量相似搜索

在搜索推荐中，通常使用相似Embedding进行推荐，此时就会有一个问题：如何快速找到与一个Embedding相近的其他Embedding如果两个Embedding在同一个向量空间中，我们就可以通过很多种方式（内积、余弦、欧氏距离等）计算其相似度；例如在推荐系统中，用户和物品的Embedding都在同一个空间中，物品总数为$n$，那么计算一个用户和所以物品向量相似度的时间复杂度是$O(n)$，而$n$通常都能达到百万甚至上亿，这样的计算方式是无法接受的；1朴素方法1.1聚类如果将相似点聚类在一起，在检索相似向量的时候则可以快速缩小范围，只计算目标Embedding所在的聚类范围内的

局部哈希 span strong Embedding 人工智能

局部敏感哈希-向量相似搜索

在搜索推荐中，通常使用相似Embedding进行推荐，此时就会有一个问题：如何快速找到与一个Embedding相近的其他Embedding如果两个Embedding在同一个向量空间中，我们就可以通过很多种方式（内积、余弦、欧氏距离等）计算其相似度；例如在推荐系统中，用户和物品的Embedding都在同一个空间中，物品总数为$n$，那么计算一个用户和所以物品向量相似度的时间复杂度是$O(n)$，而$n$通常都能达到百万甚至上亿，这样的计算方式是无法接受的；1朴素方法1.1聚类如果将相似点聚类在一起，在检索相似向量的时候则可以快速缩小范围，只计算目标Embedding所在的聚类范围内的

局部哈希 span strong Embedding 人工智能

我们一起看看如何提升指标敏感度？

你好，这里是巡山猫编辑部，我是巡山猫。最近在梳理过去的项目中的指标，看看不同的场景下，使用哪些指标更合适。随着整理，发现很多时候，我们对指标的应用仅思考是否能够度量一个业务场景，并没有思考是不是有更好的口径，或者指标。下面我们就以一个具体的例子来讲讲不同指标的不同口径，有什么差异。指标如何选择我们来看一个场景：当我们打开京东时，我们要计算页面中「精选」模块的点击情况，我们该怎么计算?相信你能想到CTR，也就是点击次数/PV，算出来是平均一次PV，有多少次点击但是这么算真的合理吗?思考30秒，再往下看。就分子来说，点击次数没有异议，点击了多少次就是多少次。但是PV呢?PV其实有三种计算方式：1、

我们一起口径的 CTR 运维网络运维 $指标敏感度

我们一起看看如何提升指标敏感度？

你好，这里是巡山猫编辑部，我是巡山猫。最近在梳理过去的项目中的指标，看看不同的场景下，使用哪些指标更合适。随着整理，发现很多时候，我们对指标的应用仅思考是否能够度量一个业务场景，并没有思考是不是有更好的口径，或者指标。下面我们就以一个具体的例子来讲讲不同指标的不同口径，有什么差异。指标如何选择我们来看一个场景：当我们打开京东时，我们要计算页面中「精选」模块的点击情况，我们该怎么计算?相信你能想到CTR，也就是点击次数/PV，算出来是平均一次PV，有多少次点击但是这么算真的合理吗?思考30秒，再往下看。就分子来说，点击次数没有异议，点击了多少次就是多少次。但是PV呢?PV其实有三种计算方式：1、

我们一起口径的 CTR 运维网络运维 $指标敏感度

与ChatGPT共享敏感业务数据可能存在风险

随着AI聊天机器人潜力的来龙去脉继续成为头条新闻，围绕ChatGPT的狂热仍然处于狂热状态。引起安全领域许多人注意的一个问题是，该技术对敏感业务数据的摄取是否会给组织带来风险。有人担心，如果有人输入敏感信息——季度报告、内部演示材料、销售数字等——并要求ChatGPT在其周围书写文本，那么任何人只要向ChatGPT询问就可以获得该公司的信息之后。其影响可能是深远的：想象一下，正在处理一个内部演示文稿，其中包含新的公司数据，揭示了一个要在董事会会议上讨论的公司问题。将这些专有信息泄露出去可能会破坏股价、消费者态度和客户信心。更糟糕的是，泄露的议程上的法律项目可能会使公司承担真正的责任。但是这些

ChatGPT 与的泄露人工智能 $ChatGPT 共享敏感业务

与ChatGPT共享敏感业务数据可能存在风险

随着AI聊天机器人潜力的来龙去脉继续成为头条新闻，围绕ChatGPT的狂热仍然处于狂热状态。引起安全领域许多人注意的一个问题是，该技术对敏感业务数据的摄取是否会给组织带来风险。有人担心，如果有人输入敏感信息——季度报告、内部演示材料、销售数字等——并要求ChatGPT在其周围书写文本，那么任何人只要向ChatGPT询问就可以获得该公司的信息之后。其影响可能是深远的：想象一下，正在处理一个内部演示文稿，其中包含新的公司数据，揭示了一个要在董事会会议上讨论的公司问题。将这些专有信息泄露出去可能会破坏股价、消费者态度和客户信心。更糟糕的是，泄露的议程上的法律项目可能会使公司承担真正的责任。但是这些

ChatGPT 与的泄露人工智能 $ChatGPT 共享敏感业务