博客
关于我
关于Java中的getBytes()的原理理解以及演算
阅读量:161 次
发布时间:2019-02-27

本文共 679 字,大约阅读时间需要 2 分钟。

当你调用String.getBytes()时,Java会根据字符串的内容和指定的编码方式将每个字符转换为相应的字节。具体过程如下:

  • Java String的内部表示:Java String使用UTF-16编码存储字符,这意味着每个字符可能由1或2个16-bit值组成(即2或4个字节)。

  • 编码方式的选择String.getBytes()默认使用平台默认编码(通常是UTF-8),但可以指定其他编码方式。

  • 转换过程

    • 遍历字符串中的每个字符。
    • 对于每个字符,根据编码方式将其转换为字节。
    • 不同编码方式会影响结果,例如UTF-8处理字符的方式与ISO-8859-1不同。
  • 示例分析:以字符串“abcD热爱技术”为例:

    • 'a' -> 97
    • 'b' -> 98
    • 'c' -> 99
    • 'D' -> 68
    • '热' -> 在UTF-8中为0xEF 0xBF 0xBD
    • '爱' -> 0xE4 0xA4 0xB5
    • '技术' -> 0xE7 0xA8 0xA2
    • 继续类推,直到所有字符转换完成。
  • 不同编码方式的影响:使用不同的编码方式会导致字节数组的不同。例如,使用ISO-8859-1可能会有不同的结果,而UTF-8则能更准确地表示所有字符。

  • 手动演算示例

    String str = "abcD热爱技术";byte[] bytes = str.getBytes("UTF-8");// bytes数组将包含上述每个字符转换后的字节

    这段代码将生成一个字节数组,包含所有字符转换后的结果。

  • 通过以上步骤,你可以理解字符串转换为字节数组的原理,并根据需要选择合适的编码方式。

    转载地址:http://autb.baihongyu.com/

    你可能感兴趣的文章
    pandas DataFrame的一些操作
    查看>>
    Pandas Dataframe的日志文件
    查看>>
    Pandas df.iterrows() 并行化
    查看>>
    pandas GROUPBY+变换和多列
    查看>>
    pandas Groupby:创建两列的Groupby时,如何按正确的顺序对工作日进行排序?
    查看>>
    Pandas matplotlib 无法显示中文
    查看>>
    pandas PIVOT_TABLE保持索引
    查看>>
    Pandas Plots:周末的单独颜色,x 轴上漂亮的打印时间
    查看>>
    pandas to_latex() 转义数学模式
    查看>>
    Pandas 中文官档 ~ 基础用法4
    查看>>
    Pandas 中的多索引旋转
    查看>>
    Pandas 中的日期范围
    查看>>
    pandas 中的时间序列箱线图
    查看>>
    Pandas 使用指南
    查看>>
    pandas 分组并使用最小值更新
    查看>>
    pandas 均值(mean), 均值填充NA(fill_na)
    查看>>
    Pandas 对数据框的布尔比较
    查看>>
    pandas 将通话数据分割为15分钟的间隔
    查看>>
    pandas 找到局部最大值和最小值
    查看>>
    pandas 按日期和年份分组,并汇总金额
    查看>>