我正在尝试让 C 控制台应用程序可以在 scanf 或 gets 中读取(使用键盘)特殊的西类牙字符,例如重音符、'ñ' 等然后,也用 printf 打印它。
由于包 locale.h,我已经实现了正确显示这些字符(存储在变量中或直接来自 printf)。我举个例子:
#include <stdio.h>
// Add languaje package
#include <locale.h>
int main(void)
{
char string[254];
// Set languaje to Spanish
setlocale(LC_ALL, "spanish");
// Show correctly spanish special chars
printf("¡Success!. It is shown special chars like 'ñ' or 'á'.\n\n\n");
// Gets special chars by keyboard
printf("Input spanish special chars (such 'ñ'): ");
gets(string);
printf("Your string is: %s", string);
return 0;
}
但我还没有实现用上面提到的功能正确地拾取它们。
有人知道怎么做吗?
谢谢。
在测试中,我观察到:
setlocale(LC_ALL, "spanish"); 它正确显示西类牙语字符,但不从键盘收集它们。setlocale(LC_ALL, "es_ES"); 它从键盘正确拾取西类牙文字符,但显示效果不佳。
我也尝试过 setlocale(LC_ALL, "");, setlocale(LC_ALL, "es_ES.UTF-8"); 和 setlocale(LC_ALL , "es_ES.ISO_8859-15"); 与 EDIT 1 的结果相同(或从键盘捕获良好的字符或在控制台中很好地显示它们,但绝不会同时出现) .
最佳答案
Microsoft 的 C 运行时库 (CRT) 不支持 UTF-8 作为语言环境编码。它只支持 Windows 代码页。此外,“es_ES”不是有效的 CRT 语言环境字符串,因此 setlocale 会失败,使您处于默认的 C 语言环境。 Microsoft 的 CRT 的较新版本支持 Windows 区域设置名称,例如“es-ES”(连字符,而不是下划线)。否则 CRT 使用全名或旧的 3 字母缩写,例如“spanish_spain”、“esp_esp”或“esp_esp.1252”。
但这还没有结束。当使用传统文本编码而不是 Unicode 读取和写入控制台时,控制台本身还有另一层翻译。为避免 mojibake,您必须设置控制台输入和输出代码页(即 SetConsoleCP 和 SetConsoleOutputCP)以匹配语言环境代码页。如果您仅限于使用西类牙语或 Latin-1,那么应该可以将区域设置设置为“西类牙语”并通过 SetConsoleCP(1252) 和 SetConsoleOutputCP(1252)<>。更一般地说,您可以查找给定语言环境名称的 ANSI 代码页,设置控制台代码页,并保存它们以便在退出时重置控制台。例如:
wchar_t *locale_name = L"es-ES";
if (_wsetlocale(LC_ALL, locale_name)) {
int codepage;
gPrevConsoleCP = GetConsoleCP();
if (gPrevConsoleCP) { // The process is attached to a console.
gPrevConsoleOutputCP = GetConsoleOutputCP();
if (GetLocaleInfoEx(locale_name,
LOCALE_IDEFAULTANSICODEPAGE |
LOCALE_RETURN_NUMBER,
(LPWSTR)&codepage,
sizeof(codepage) / sizeof(wchar_t))) {
if (!codepage) { // The locale doesn't have an ANSI codepage.
codepage = GetACP();
}
SetConsoleCP(codepage);
SetConsoleOutputCP(codepage);
atexit(reset_console);
}
}
}
也就是说,在使用控制台工作时,如果将 stdin 和 stdout 设置为使用 _O_U16TEXT 模式并且使用宽字符函数,例如 fgetws 和 wprintf。最终,如果 C 运行时库支持,这应该使用宽字符控制台 I/O 函数 ReadConsoleW 和 WriteConsoleW。使用 UTF-16 宽字符模式的缺点是需要完全重写代码以使用 wchar_t 字符串和宽字符函数,并且还需要为使用多字节的库实现适配器编码字符串(最好是 UTF-8)。
关于c - 在控制台应用程序 C 中读/写特殊字符(如波浪号、ñ、...),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49557472/
总的来说,我对ruby还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用
我有一个字符串input="maybe(thisis|thatwas)some((nice|ugly)(day|night)|(strange(weather|time)))"Ruby中解析该字符串的最佳方法是什么?我的意思是脚本应该能够像这样构建句子:maybethisissomeuglynightmaybethatwassomenicenightmaybethiswassomestrangetime等等,你明白了......我应该一个字符一个字符地读取字符串并构建一个带有堆栈的状态机来存储括号值以供以后计算,还是有更好的方法?也许为此目的准备了一个开箱即用的库?
我的目标是转换表单输入,例如“100兆字节”或“1GB”,并将其转换为我可以存储在数据库中的文件大小(以千字节为单位)。目前,我有这个:defquota_convert@regex=/([0-9]+)(.*)s/@sizes=%w{kilobytemegabytegigabyte}m=self.quota.match(@regex)if@sizes.include?m[2]eval("self.quota=#{m[1]}.#{m[2]}")endend这有效,但前提是输入是倍数(“gigabytes”,而不是“gigabyte”)并且由于使用了eval看起来疯狂不安全。所以,功能正常,
在我的Rails(2.3,Ruby1.8.7)应用程序中,我需要将字符串截断到一定长度。该字符串是unicode,在控制台中运行测试时,例如'א'.length,我意识到返回了双倍长度。我想要一个与编码无关的长度,以便对unicode字符串或latin1编码字符串进行相同的截断。我已经了解了Ruby的大部分unicode资料,但仍然有些一头雾水。应该如何解决这个问题? 最佳答案 Rails有一个返回多字节字符的mb_chars方法。试试unicode_string.mb_chars.slice(0,50)
我需要在客户计算机上运行Ruby应用程序。通常需要几天才能完成(复制大备份文件)。问题是如果启用sleep,它会中断应用程序。否则,计算机将持续运行数周,直到我下次访问为止。有什么方法可以防止执行期间休眠并让Windows在执行后休眠吗?欢迎任何疯狂的想法;-) 最佳答案 Here建议使用SetThreadExecutionStateWinAPI函数,使应用程序能够通知系统它正在使用中,从而防止系统在应用程序运行时进入休眠状态或关闭显示。像这样的东西:require'Win32API'ES_AWAYMODE_REQUIRED=0x0
对于具有离线功能的智能手机应用程序,我正在为Xml文件创建单向文本同步。我希望我的服务器将增量/差异(例如GNU差异补丁)发送到目标设备。这是计划:Time=0Server:hasversion_1ofXmlfile(~800kiB)Client:hasversion_1ofXmlfile(~800kiB)Time=1Server:hasversion_1andversion_2ofXmlfile(each~800kiB)computesdeltaoftheseversions(=patch)(~10kiB)sendspatchtoClient(~10kiBtransferred)Cl
大约一年前,我决定确保每个包含非唯一文本的Flash通知都将从模块中的方法中获取文本。我这样做的最初原因是为了避免一遍又一遍地输入相同的字符串。如果我想更改措辞,我可以在一个地方轻松完成,而且一遍又一遍地重复同一件事而出现拼写错误的可能性也会降低。我最终得到的是这样的:moduleMessagesdefformat_error_messages(errors)errors.map{|attribute,message|"Error:#{attribute.to_s.titleize}#{message}."}enddeferror_message_could_not_find(obje
我试图获取一个长度在1到10之间的字符串,并输出将字符串分解为大小为1、2或3的连续子字符串的所有可能方式。例如:输入:123456将整数分割成单个字符,然后继续查找组合。该代码将返回以下所有数组。[1,2,3,4,5,6][12,3,4,5,6][1,23,4,5,6][1,2,34,5,6][1,2,3,45,6][1,2,3,4,56][12,34,5,6][12,3,45,6][12,3,4,56][1,23,45,6][1,2,34,56][1,23,4,56][12,34,56][123,4,5,6][1,234,5,6][1,2,345,6][1,2,3,456][123
我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案 他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%
Rackup通过Rack的默认处理程序成功运行任何Rack应用程序。例如:classRackAppdefcall(environment)['200',{'Content-Type'=>'text/html'},["Helloworld"]]endendrunRackApp.new但是当最后一行更改为使用Rack的内置CGI处理程序时,rackup给出“NoMethodErrorat/undefinedmethod`call'fornil:NilClass”:Rack::Handler::CGI.runRackApp.newRack的其他内置处理程序也提出了同样的反对意见。例如Rack