数据库性能优化，关于oracle字符串比较优化的改进方案，大家拍砖 - 代码天地

数据库性能优化，关于oracle字符串比较优化的改进方案，大家拍砖

其他 2020-04-11 00:26:33 阅读次数: 0

因为公司的单个业务数据达到千W级别，并且有源源不断的新数据进来。新数据进来都需要进行查重，重复数据不能进来，查重条件有很多字符串的对比，最大的字符串不超过1000个字符，但是字符串的比较，对于数据库来说，非常的耗性能，如果能将String转成数字来进行比较对于性能的提高将非常有用。

后来想到String有一个hashcode，看看能否使用：

    <SPAN style="FONT-SIZE: small">/**
     * Returns a hash code for this string. The hash code for a
     * <code>String</code> object is computed as
     * <blockquote><pre>
     * s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]
     * </pre></blockquote>
     * using <code>int</code> arithmetic, where <code>s[i]</code> is the
     * <i>i</i>th character of the string, <code>n</code> is the length of
     * the string, and <code>^</code> indicates exponentiation.
     * (The hash value of the empty string is zero.)
     *
     * @return  a hash code value for this object.
     */
    public int hashCode() {
	int h = hash;
        int len = count;
	if (h == 0 && len > 0) {
	    int off = offset;
	    char val[] = value;

            for (int i = 0; i < len; i++) {
                h = 31*h + val[off++];
            }
            hash = h;
        }
        return h;
    }</SPAN>

但是遗憾的是int的范围非常窄（-2147483648——2147483647），出现重复的概率虽然说比较低，但是不可避免会出现重复的可能性。

于是想到，是否可以自己重新写过hashcode方法，将int的范围扩大到long类型（-9223372036854774808~9223372036854774807），这样在目前长度的字符生成的hashcode出现重复的可能性应该几乎为零。

大家对于这个设想是否有什么更好的意见？

发布了19 篇原创文章 · 获赞 2 · 访问量 3130

私信关注

猜你喜欢

转载自blog.csdn.net/beyondqinghua/article/details/84097800

数据库性能优化，关于oracle字符串比较优化的改进方案，大家拍砖

Impala与MySQL：比较优化Impala数据库性能的方法

数据库性能优化方案

ORACLE数据库性能优化概述

Oracle数据库性能优化

Oracle数据库访问性能优化

Oracle 数据库查询优化方案

String字符串性能优化的几种方案

Mysql性能优化，三范式，数据库优化方案

数据库性能优化-SQL优化 mysql oracle

关于字符串拼接与文档碎片（性能优化）

equals代码比较优化

透过源码学优化：String字符串性能优化的方案，你知道几种？

百度数据开发面试题 Oracle行转列、列转行的Sql语句总结(转) oracle拆分逗号分隔字符串实现split Oracle数据库该如何着手优化一个SQL Oracle高水位线(HWM)及性能优化

关于Oracle数据库数据类型(1）——字符串类型

Mysql的数据库优化，改进

Oracle数据库性能优化-表连接与优化器（基于ORACLE数据库sql优化）

Java字符串之性能优化

Java性能优化：字符串过滤

性能优化——字符串(String)

数据库性能的优化

数据库性能优化

数据库 - 性能优化

数据库性能优化的五种方案

性能优化之数据库优化

性能优化-MySQL数据库优化

oracle数据库性能优化之sga调整

优化数据库大幅度提高Oracle的性能

基于Oracle数据库性能优化技术的研究

关系型数据库（Oracle）性能优化（三）

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)